Наши инвестиции в Continual — Авторы: Харпиндер Сингх и Дэвис Трейбиг

Трудно количественно оценить масштабы влияния, которое машинное обучение оказало на мир за последнее десятилетие. Такие области, как перевод, обработка изображений, поиск, понимание естественного языка, робототехника и обработка сигналов, были полностью преобразованы в результате современных методов машинного обучения. Тем не менее, во многих отношениях внедрение машинного обучения еще очень рано. Несмотря на огромные инвестиции в инструменты машинного обучения и исследования за последнее десятилетие, количество компаний, которые сегодня создают и развертывают операционные системы машинного обучения, чрезвычайно мало.

Эта двойственность связана со значительной сложностью, которая все еще существует при создании и производстве систем машинного обучения. Подготовка данных, конвейеры данных, проектирование функций, управление инфраструктурой и общий рабочий процесс разработки программного обеспечения для объединения всего этого (версионирование, управление моделями, A/B-тестирование, мониторинг, переобучение) образуют почти непреодолимый барьер для большинства команд. Это, по большей части, привело к рынку «имущих» и «неимущих». В то время как технологические гиганты, такие как Doordash, Netflix и Uber, могут нанять редких инженеров по машинному обучению, способных делать все это для создания систем, подобных показанной ниже, большинство компаний остаются неспособными выйти за рамки офлайн-моделей в ноутбуках Jupyter.

Тристан Зайонц интуитивно чувствовал это как технический директор подразделения машинного обучения Cloudera. Он будет работать с бесчисленным количеством компаний, которые видят огромную потенциальную ценность машинного обучения, но которые также чувствуют себя парализованными кажущейся сложностью таких систем. Действительно, даже простые варианты использования, в которых готовые модели могут легко помочь вам очень далеко — прогнозирование доходов, прогнозирование оттока, планирование спроса и т. д. — увязли в сложности, поскольку клиенты пытались перевести их в производство.

Тем не менее, в то же время Тристан увидел фундаментальный сдвиг, происходящий в пространстве данных. Облачные хранилища данных стали новым субстратом, значительно упростившим инфраструктуру, а новое поколение инструментов, таких как dbt, использовало их для полной трансформации области обработки данных. То, что раньше требовало команды инженеров, имеющих опыт работы с распределенными системами и Spark, теперь может сделать тот, кто просто знает SQL. Строгость разработки программного обеспечения инструментов предыдущего поколения была сохранена, но доступность значительно увеличилась. В результате аналитики данных внезапно значительно повысили уровень своего влияния; теперь они могли создавать конвейеры данных производственного уровня, и количество компаний, которые действительно могли выполнять крупномасштабные работы по моделированию данных, значительно увеличилось.

Тристан понял, что нет никаких причин, по которым вы не можете использовать те же тенденции и принципы, чтобы аналогичным образом демократизировать доступ к операционным системам машинного обучения. Итак, он объединился со своим давним другом Тайлером Коном, бывшим техническим директором RichRelevance, и они решили запустить Continual. На самом простом уровне Continual — это уровень искусственного интеллекта для современного стека данных. Он находится поверх вашего хранилища данных и позволяет аналитикам данных, знающим SQL, обучать, развертывать и производить модели машинного обучения, которые постоянно переобучают и повторно запускают логические выводы, и вам не нужно управлять единым элементом инфраструктуры. Продукт смехотворно прост, но обладает достаточной функциональностью в отношении тестирования, контроля версий, рабочих процессов, подобных git, управления моделями, хранения функций и т. д., чтобы он мог поддерживать действительно работающие модели — баланс, который был достигнут во многих предыдущих поколениях инструментов AutoML. не удалось достичь.

Если вы привыкли к dbt, основной рабочий процесс Continual сразу же найдет отклик у вас. Многие из первых клиентов Continual, такие как Veronica Beard, Enverus и Aurora Solar, являются пользователями dbt, которые пытаются еще больше повысить свой уровень, перейдя от описательной аналитики к системам прогнозирования, которые помогают принимать бизнес-решения. Continual дает этим командам аналитиков супервозможности машинного обучения, позволяя им внедрять прогностическую аналитику в продажи, маркетинг, успех клиентов и операции.

Но история на этом не заканчивается. Компания Continual создала продукт, радикально упрощающий сквозное взаимодействие пользователей с моделями машинного обучения за счет четкого отделения декларативного бизнес-уровня от операционного уровня MLOps. Это так же полезно для команд по науке о данных, как и для инженеров-аналитиков. Немногие специалисты по данным хотят иметь дело с Kubernetes или объединять более 5 инструментов MLOps для каждого варианта использования машинного обучения. Действительно, даже очень крупные компании с чрезвычайно талантливыми инженерными командами машинного обучения, такие как Apple и Uber, создали аналогичные декларативные системы машинного обучения для своих внутренних команд, чтобы дать всем пользователям возможность создавать модели быстрее и надежнее. Мы считаем, что у Continual есть возможность стать унифицированным субстратом для MLOps во многих организациях, как для аналитика SQL, решающего более простой вариант использования с готовой моделью, так и для специалиста по данным, который хочет использовать свою собственную модель или расширить возможности. вся их организация с новыми стандартизированными возможностями машинного обучения.

Таким образом, мы очень рады объявить о наших ведущих инвестициях в раунд Continual Series A. Тристан и Тайлер имеют богатый опыт в области обработки данных и машинного обучения, и мы не могли представить себе лучшего дуэта для создания этой компании. К нам присоединяются несколько известных игроков в современном стеке данных, в том числе Тристан Хэнди, генеральный директор dbt labs; Эллисон Пикенс, член правления dbt labs; Томер Ширан, основатель Dremio; усилить предприятия; и DataCouncil. Эти инвестиции представляют собой продолжение нашего внимания к компаниям, специализирующимся на хранилищах данных, таким как Panther, Revsure и Eppo, и в более широком смысле подчеркивает нашу неизменную веру в огромное влияние машинного обучения на мир.