tl;dr: С помощью Tanzu Application Platform и VMware Data Solutions инженеры машинного обучения могут реализовывать сквозные операции машинного обучения независимо от облака, используя первый в отрасли инструментарий с открытым исходным кодом, передовые продукты для работы с данными и готовый к работе с GitOps фундамент.

MLOps: упрощение пути к готовому к производству машинному обучению

Сегодня мир ИИ должен столкнуться со странным парадоксом. Благодаря появлению современных архитектур моделей, сверхбольших данных и недавним достижениям в области вычислений, хранения и сетей влияние ИИ и машинного обучения на современную промышленность было революционным. Тем не менее, рабочий процесс самого ИИ продолжает значительно отставать. Опросы показывают, что до 90% моделей машинного обучения не попадают в производство, а развертывание тех, которые все же удается, занимает до трех месяцев (в среднем). Переход от пилотного к серийному производству остается серьезной проблемой для многих предприятий.

MLOps был разработан, чтобы попытаться решить эту проблему. Используя такие механизмы, как автоматизация (полная и частичная), постоянное совершенствование, непрерывный мониторинг и совместное сотрудничество, он обеспечивает основу для управления и развертывания моделей машинного обучения с большей эффективностью, гибкостью и безопасностью. Если это звучит знакомо, то это потому, что так оно и есть: MLOps на самом деле является ответвлением DevOps. Когда в 2000-х годах впервые зародился DevOps, у корпоративных разработчиков были похожие проблемы с выпуском рабочих нагрузок своих приложений в производство в больших масштабах. Теперь быстродействующие и гибкие команды разработчиков программного обеспечения стали гораздо более распространенным явлением. В свою очередь, MLOps стремится воспроизвести успехи DevOps в мире разработки программного обеспечения, включив те же основополагающие принципы, а также управляя специфическими проблемами ML, такими как дрейф, управление, доверие и непрерывное обучение.

Почему платформа приложений Tanzu для MLOps?

Платформа приложений Tanzu (TAP) как нативная платформа DevOps может использоваться в качестве центрального узла для развертывания и управления инструментами, конвейерами и артефактами MLOps в разных командах. Некоторые из его преимуществ включают в себя:

  • Межоблачный ИИ. TAP позволяет использовать одни и те же базовые операции для управления рабочими нагрузками и артефактами машинного обучения независимо от облачной среды. В отличие от многих проприетарных платформ, TAP не зависит от облака и поддерживает локальные, гибридные и общедоступные облачные среды. Он делает это, используя Kubernetes под капотом, но с удобным уровнем абстракции. Используя такие инструменты, как tanzu cli, Carvel tools, Bitnami Services и Crossplane with TAP, инженеры машинного обучения могут обнаруживать, развертывать, создавать и/или интегрировать платформы машинного обучения, инструменты, пайплайны, пользовательские приложения и источники данных без обширных знаний. Кубернетес.
  • Первое решение с открытым исходным кодом: TAP совместим с основными решениями и инструментами MLOps с открытым исходным кодом, такими как Kubeflow Pipelines, MLflow, Argo Workflows, Jupyterhub, Tensorflow Serving и т. д. Это согласуется с стратегия машинного обучения растущего числа предприятий. Для многих ориентированные на сообщество быстрые инновации, экономичность и гибкость машинного обучения с открытым исходным кодом делают его предпочтительным подходом для предотвращения привязки к поставщику, особенно с учетом того, что варианты машинного обучения с открытым исходным кодом продолжают распространяться и развиваться. TAP предоставляет простые кнопки для интеграции с ускорителями машинного обучения, пакетами Carvel и Каталогом приложений VMware и позволяет беспрепятственно смешивать и сопоставлять фреймворки и инструменты от разных поставщиков.
  • CICD-native: TAP предоставляет несколько встроенных примитивов для автоматизации непрерывного развертывания приложений, моделей и конвейеров машинного обучения в удобной для GitOps манере. Используя Supply Chains, AppCR для упрощенных конвейеров, Tanzu Cloud-native Buildpacks для автоматизированной сборки контейнеров и Knative Services для бессерверных развертываний, TAP позволяет инженерам машинного обучения дополнять рабочие процессы MLOps и параметры логического вывода автоматизацией, готовой к DevOps. для всех развертываний рабочих нагрузок машинного обучения.

Решения VMware для данных: интеграция данных и машинного обучения

Данные не всегда рассматриваются как первоклассный принцип MLOps, когда возникает тема. Тем не менее, среди факторов, необходимых для успешных MLOps, возможно, ничто не имеет такого большого значения, как данные. Действительно, данные и машинное обучение неразрывно связаны в производстве. Даже самые современные модели могут работать только так, как данные, на которых они обучены. Такие факторы, как размер данных, распределение, масштабируемость, новизна, задержка, согласованность и локальность, оказывают существенное влияние на мощность модели. В свою очередь, многие из этих факторов прямо (или косвенно) связаны с производительностью, возможностями и масштабируемостью базовой платформы данных. С VMware Data Solutions специалисты по данным и инженеры по машинному обучению могут использовать лучший в отрасли портфель масштабируемых платформ данных с высокой пропускной способностью и малой задержкой для многих передовых вариантов использования AI / ML, включая хранилище данных MPP, in- аналитика баз данных, масштабируемые хранилища функций, потоковая обработка в реальном времени и многое другое. Эти решения также являются облачными, не зависят от облака и совместимы с TAP.

Следите за новостями в новой серии блогов, в которых будет более подробно рассказано о многих возможностях межоблачного ИИ с помощью TAP и решений VMware Data Solutions, от стандартных MLOps до LLMOps.