Что ждет MLOps в будущем?

Времена, когда MLOps считались воздушным замком, давно прошли. Ажиотаж вокруг MLOps превратился в неизбежную реальность, и организации по-прежнему вкладывают значительные средства в поиск инструментов, позволяющих им устойчиво применять свои возможности ИИ на практике. И здесь, в Inkef, мы разделяем восторг от инновационных решений в области MLOps!

Много было написано о MLOps и его обещании революционизировать то, как предприятия используют ИИ, но давайте отмотаем время назад на несколько тиков и быстро подведем итоги.

Быстрое развитие вычислительной мощности и облачной инфраструктуры в сочетании с повышением доступности данных и наборов инструментов с открытым исходным кодом привело к стремительному внедрению AI/ML в компаниях любого размера. За последнее десятилетие мы стали свидетелями бурного развития приложений ИИ, от инструментов оптимизации цепочек поставок до систем обнаружения мошенничества и поиска и производства лекарств на основе машинного обучения. Однако, хотя организации осознали, что ИИ — это не приятно иметь, а скорее ключевой компонент успеха, они также столкнулись с реальностью, что внедрение и масштабирование машинного обучения для повышения ценности бизнеса — непростая задача. Таким образом, с более широким внедрением AI/ML для использования в компаниях внедрение структурированных процессов для надежной и эффективной разработки, развертывания и обслуживания этих решений стало обязательным.

MLOps вошли в чат

В головоломке MLOps много частей: от управления наборами данных до моделей обучения и мониторинга и реализации масштабируемых процессов, которые можно повторять в организации, MLOps представляет собой набор лучших практик, чтобы убедиться, что эти части хорошо сочетаются друг с другом, позволяя для эффективного управления всеми доменами жизненного цикла машинного обучения.

С момента своего зарождения в 2015 году концепция MLOps находилась в центре внимания. Несмотря на вложенные многочисленные ресурсы и достигнутый быстрый рост, MLOps по-прежнему является относительно новой концепцией в мире ИИ, и еще есть много возможностей для улучшения. В конце концов, данные говорят сами за себя: примерно 1 из 2 ИИ-проектов так и не доходит до стадии производства, а тем, кто это делает, требуется в среднем 7 месяцев, чтобы довести модель до этой стадии, и дополнительные 7 месяцев, чтобы он начал приносить пользу бизнесу. Хотя за этими неудачами стоит несколько причин, ясно, что есть несколько проблем, которые еще предстоит решить. Очевидно, что отрасль все еще находится на подъеме, и сокращение разрыва в MLOps представляет собой прибыльную рыночную возможность, оцениваемую в 6 миллиардов долларов США к 2028 году.

Рынок постоянно растет высокими темпами, а набор инструментов MLOps становится богаче и сложнее. На арену вышло множество игроков, конкурирующих на мировом рынке и обещающих лучший способ производства машинного обучения, от крупных облачных провайдеров до нишевых и специализированных инструментов. Чтобы помочь ориентироваться в пространстве, мы можем выделить три основные категории игроков:

  1. Нативный облачный стек, предлагаемый крупными поставщиками облачных услуг, подумайте об Amazon, Google или Microsoft. Эти проигрыватели предлагают почти полное решение, которое охватывает большую часть опыта разработчиков. Одним из больших преимуществ этих решений является то, что они упрощают задачи интеграции благодаря унифицированному интерфейсу. Однако плавность этих сквозных процессов не всегда хорошо подходит для локальной экосистемы или мультиоблачной стратегии.
  2. Платформы, предлагающие интегрированный контекстно-независимый стек, например DataRobot или MLflow. Эти игроки настойчиво заняли сильную позицию на рынке, устранив некоторые недостатки облачных предложений, и расширились, чтобы теперь предлагать почти полный опыт, добавляя больше областей жизненного цикла разработки модели к своему основному предложению.
  3. Специализированные инструменты, предоставляющие лучшее в своем классе модульное программное обеспечение, которое можно легко интегрировать в любой рабочий процесс, например BentoML для развертывания моделей или Neptune.ai для экспериментов и регистрации моделей. Несмотря на то, что внедрение этих инструментов может привести к необходимости исправлять отдельные детали, оно также позволяет организациям адаптировать и настраивать свою экосистему и внедрять лучшие в своем классе решения на протяжении всего жизненного цикла разработки машинного обучения.

Суть в том, что, хотя конкуренция является жесткой, и мы предвидим консолидацию в пространстве, когда более крупные игроки приобретают более мелких, в настоящее время не существует единого стека технологий, который превосходил бы остальные, предлагая комплексное решение. Таким образом, мы считаем, что у специализированных игроков все еще есть возможности занять сильную позицию на рынке и добиться фундаментальных изменений. В этой статье мы подробно остановимся на одной из областей MLOps (подробнее об этом в следующих статьях!), которая вызывает у нас энтузиазм и в которой мы заинтересованы в изучении будущих инвестиционных возможностей: наблюдаемость модели.

Но прежде чем перейти непосредственно к этому, мы хотим выделить три основные тенденции, которые, по нашему мнению, еще больше подчеркивают, насколько важно для организаций повышать уровень наблюдаемости:

  1. Высокоскоростное производство — стало очень конкурентоспособно развертывание ИИ, чем быстрее вы выходите на рынок и чем лучшее решение вы предоставляете, тем легче вам выжить в быстро меняющейся и гиперконкурентной среде. где возможности ИИ стали явным отличительным фактором.
  2. Необходимость снижения затрат — внедрение ИИ в производство может быть очень дорогостоящим, кроме того, модели быстро изнашиваются, и можно ожидать снижения производительности и дрейфа, например. с новыми данными, поступающими в конвейер. Таким образом, крайне важно эффективно контролировать и поддерживать существующие модели в производстве.
  3. Внешнее давление с целью обеспечения прозрачности и соответствия требованиям. Решения ИИ должны быть не только точными, но и объяснимыми. Усилия по объяснимости продолжаются после того, как модель построена. Всегда должно быть ясно, как ведет себя модель и почему.

Наблюдаемость модели

Поскольку в производство внедряется все больше и больше моделей, мы считаем, что наблюдаемость модели имеет первостепенное значение для успешного обслуживания, масштабирования и ввода в действие решений машинного обучения. Неудивительно, что создание моделей в исследовательской среде и их развертывание в реальном мире — это две совершенно разные концепции. После запуска в производство модели имеют тенденцию ухудшаться, а производительность ухудшаться из-за общих проблем, таких как дрейф модели или данных, изменения распределения, проблемы с качеством данных и предвзятость. Инструменты наблюдения позволяют группам инженеров и специалистов по обработке и анализу данных лучше понимать, отслеживать, устранять неполадки и объяснять модели машинного обучения на разных этапах жизненного цикла разработки: от обучения до развертывания и в процессе производства. Эти инструменты не только отвечают на вопросы о том, что и когда пошло не так, но также дают представление о том, как и почему, позволяя техническим командам не обнаруживать и решать проблемы быстрее и эффективнее, а полностью понимать и объяснять поведение своей модели. и прогнозы.

Цитирую Апарна Дхинакаран, соучредителя и директора по продажам в Arize AI:

Наблюдаемость — это ключевое различие между командой, которая летит вслепую после развертывания модели, и командой, которая может быстро повторять и улучшать свои модели.

В список наблюдения входят: Aporia, Arize, Deepchecks, Superwise.

Вы являетесь основателем, инвестором, оператором или кем-либо, кто так же, как и мы, взволнован будущим MLOps? Следите за будущими сообщениями в блоге об этом пространстве и обращайтесь к chiara[at]inkef.com, чтобы пообщаться.