Настоящее и ближайшее будущее данных

Краткий и приятный прогноз тенденций от руководителя данных, который живет этим.

Фернандо Эскобар, руководитель отдела обработки данных в Loka, Inc.

Привет, я Фер. Большую часть последнего десятилетия я специализировался на анализе данных и разработке данных для стартапов из списка Fortune 500 и Series-A. Вот что я вижу в 2021 году.

Когда я думаю о том, как бы я определил данные, мне приходит на ум многое. Это факты, это наблюдения, это поведение — все это собрано воедино, чтобы потом на него можно было сослаться и проанализировать.

Когда у данных есть причина, цель, и они начинают отвечать на вопросы, тогда они становятся информацией, которую мы можем использовать.

Информация может быть описательной (что произошло?) и прогнозирующей (что произойдет?). Как профессионал в области обработки данных и анализа данных, это фактически строительный блок для всего, что я делаю.

Основываясь на том, что я видел и испытал в работе с различными стартапами, каковы их потребности и что предлагает облачная индустрия, я перечислил некоторые тенденции и темы, которые вы можете ожидать, когда речь заходит об этих важных электрических сигналах.

Машинное обучение

Машинное обучение — то, о чем гудели рыночные аналитики, прогнозируя тенденции данных за последние пять лет или около того.

Несмотря на то, что за последние пару лет этот термин широко использовался многими стартапами в качестве коммерческого предложения, мы приближаемся к моменту, когда преимущества будут не только теоретическими. имеют массу практических применений. Практично — это слово, на котором я хотел бы сосредоточиться.

От разработки вакцины (обнаружение закономерностей у людей заняло бы гораздо больше времени), до земледелия (нахождение правильного баланса питательных веществ в зависимости от различных почвенных и погодных условий), до здоровья (обнаружение закономерностей в жизненном поведении в зависимости от продолжительности жизни), до транспорта (привет автономное вождение!), машинное обучение каким-то образом применяется для ускорения продукта или услуги.

В этих примерах машинное обучение играет значимую роль. Это не просто модное слово для пустых обещаний или несбыточных мечтаний, а функция, встроенная в основной функционал.

Бессерверный

В 2021 году основное внимание в области обработки данных будет уделяться бессерверному подходу. Под бессерверным подходом я подразумеваю отсутствие серверов, которые нужно обслуживать самостоятельно, а скорее серверы, которые обслуживает и масштабирует поставщик решения.

Это означает, что меньше времени нужно уделять основному компьютеру, на котором размещено ваше решение, и больше времени на его собственно разработку.

Из области AWS два основных бессерверных сервиса — Aurora Serverless и Lambda — получили значительные повышения производительности серверной части. Например, у Aurora Serverless больше нет проблемы с холодной загрузкой, а у Lambda больше времени ожидания, чем раньше, благодаря более быстрому масштабированию для тяжелых рабочих нагрузок. Просто назвать несколько.

В этом году большое внимание уделяется бессерверным технологиям, потому что специалистам по данным проще начать внедрять конвейеры без глубоких знаний о devops, что было главной проблемой: наличие серверов, которые нужно обслуживать, а также инфраструктуры, чтобы обновляться, быть работоспособным и быстрым в все время.

Serverless делает это автоматически. И не заблуждайтесь, есть серверы, на которых работает ваш код, ваша база данных, ваш REST API, ваши брокеры сообщений и потоки данных в реальном времени, но это не то, о чем вам нужно беспокоиться.

Им управляет ваш поставщик облачных услуг, который избавляет вас от этих хлопот за небольшую плату. Небольшая надбавка, позволяющая создавать более эффективно, выполнять итерации быстрее и в целом предоставлять более качественный продукт, который также можно адаптировать к более требовательным сценариям.

Короче говоря, есть две основные особенности безсерверных технологий, которые делают его таким заманчивым (и логичным) следующим шагом в моделях выполнения облачных вычислений: практически полное отсутствие обслуживания и возможность масштабирования в соответствии с вашими потребностями. потребности.

Инфраструктура как код

Если вы слышали об инфраструктуре как коде и не уделяли ей достаточно внимания или ресурсов, в этом году самое время вложиться в нее!

Эта практика продолжает развиваться и получает все большее распространение из-за того, насколько она упрощает задачу поддержки всего стека технологий.

Представьте, что весь ваш стек написан простыми шагами в виде кода и вы можете воспроизвести его, просто поместив этот код в другое место.

Нет необходимости отдельно выделять и/или подключать каждый элемент в вашем стеке. Теперь все это можно сделать с помощью строк кода, которые можно легко переносить из одной среды в другую.

Фернандо Эскобар (Fernando Escobar) — руководитель отдела данных в Loka, Inc. Фер, как его называют, обладает обширным опытом в управлении проектами, развитии бизнеса и анализе данных. Клиенты Loka из списка Fortune 500 и стартапов Series-A лучше всего знают его за превосходное управление данными от сбора до анализа, а также полезные рекомендации для руководителей. Товарищи по команде Loka знают Фера за критические обзоры игр и наушников.

Первоначально опубликовано на https://loka.com.

Настоящее и ближайшее будущее данных

Краткий и приятный прогноз тенденций от руководителя данных, который живет этим.

Машинное обучение

Бессерверный

Инфраструктура как код

Вопросы по теме