Всем привет, в этой серии я подробно расскажу о «что» и «почему» MLOps.

Это вторая часть серии, состоящей из нескольких частей, которая в настоящее время включает (и будет включать):

Ссылки будут обновляться по мере публикации разделов. Разделы с тегом Subtack будут полностью доступны в моем подстеке бесплатно.

Примечание: это будет одна из самых коротких частей серии, потому что 📰 сводка новостей: я не думаю, что определения такие уж сложные 📰.

Однако исполнение этого определения… вау, детка, вот где дьявол кроется в деталях.

Существует множество определений…

MLOps, или Операции машинного обучения, становится новым модным словечком, которое заставляет людей чесать затылки в замешательстве и думать: «Нам действительно нужно еще одно запутанное название должности в данных, которое в основном звучит вверх?".

Сначала у нас были специалисты по данным, за которыми последовали инженеры по машинному обучению и инженеры по данным, а теперь у нас есть инженеры MLOps и DataOps.

И точно так же, как у всех было свое определение Data Science (а теперь и Data Engineering), вы найдете столько определений MLOps, сколько людей.

Например, пример определений включает:

Набор практик, направленных на надежное и эффективное развертывание и поддержку конвейеров машинного обучения в производстве (источник: Википедия)

DevOps — это поведение, как и наука о данных. Подумайте о принципах как DevOps, так и науки о данных. В обоих случаях DevOps и наука о данных — это методологии оценки мира, а не обязательно уникальные названия должностей. (Книга: Практические MLOps)

По своей сути MLOps — это стандартизация и оптимизация управления жизненным циклом машинного обучения (Книга: Знакомство с MLOps)

Дисциплина пытается сделать разработку и внедрение систем машинного обучения систематизированными (Видео: Data-Centric AI)

MLOPs — это набор методов и инструментов для развертывания и надежного обслуживания систем машинного обучения в производственной среде. Короче говоря, MLOps — это среда, с помощью которой машинное обучение входит и существует в реальном мире. (Блог: MLOps — это бардак)

Ops в MLOps происходит от DevOps, сокращенно от Developments and Operations. Оперировать что-то означает запустить это в производство, что включает в себя развертывание, мониторинг и обслуживание. MLOps — это набор инструментов и лучших практик для внедрения машинного обучения в производство. (Блог: MLOps)

Другими словами, MLops = DataOps + ModelOps + DevOps. (Блог: зачем вам это нужно?)

И диаграммы Венна… давайте не будем забывать о них (слева -> справа, сверху -> вниз):

Блог: MLOps — это бардак

Википедия: MLOps

Может быть, теперь ссылка работает?

Веб-фреймворки для специалистов по обработке и анализу данных и почему вас это должно волновать

Или псевдоуравнения, давайте не будем забывать и их:

ИИ, ориентированный на данные

Часть 1. Обзор DataOps для компьютерного зрения

…Они все говорят одно и то же

Какими бы разными определениями ни звучали на первый взгляд, они отражают одно и то же чувство.

Тогда справедливая инкапсуляция:

  • MLOps – это практика масштабируемого и надежного производственного создания артефактов машинного обучения, где "артефакты" могут включать проекты, приложения, службы и трубопроводы.
  • MLOps — это применение и адаптация принципов и методов разработки программного обеспечения и DevOps к артефактам машинного обучения.

Отсюда следует, что:

  • Система MLOps или Платформа – это набор инструментов и процессов, который обеспечивает систематическую разработку и внедрение машинного обучения. артефакты.
  • Команда MLOps – это группа лиц, занимающихся проектированием, разработкой и обслуживанием Системы MLOps (или Платформы).
  • Инструмент MLOps — это технология (в форме библиотеки, платформы, службы или платформы), которая предназначена для определенного этапа жизненного цикла артефакта машинного обучения.

Отлично, теперь почему меня это должно волновать? Также у меня есть еще вопросы. Это было супер коротко.

Потрясающий! Потому что все остальные части этой серии чертовски длинные.

Почему компания, организация или даже вы как индивидуальный участник должны заботиться об этом?

Мы собираемся разобрать причины в следующей части (Часть 3: Почему ML Ops Matters: Избавляемся от MLOops), но все сводится к следующему:

  1. Снижение риска и предвзятости
  2. Сокращение нехватки кадров на рынке и поддержка существующих талантов
  3. Открытие конкурентных инноваций за счет сокращения тяжелого труда

Поэтому, если вы заинтересованы в возможности продвигать инициативы MLOps, часть 3 будет наиболее актуальной.

Список серий

Это вторая часть серии, состоящей из нескольких частей, которая в настоящее время включает (и будет включать):

  • Часть 1. Знакомство с серией статей «Что такое MLOps?»
  • Часть 3. Почему ML Ops имеет значение: избавление от MLOops
  • Часть 4: Цели MLOps как темы (подстек)
  • Часть 5: Программное обеспечение и машинное обучение до MLOps (подстек)
  • Часть 6: Проблемы масштабирования машинного обучения как программного обеспечения (подстек)

Ссылки будут обновляться по мере публикации разделов. Разделы с тегом Subtack будут полностью доступны в моем подстеке бесплатно.

Обо мне

Меня зовут Микико, и в настоящее время я работаю старшим инженером MLOps в Mailchimp.

Прежде чем перейти к MLOps, я также работал специалистом по данным, аналитиком данных и хакером роста в различных компаниях в районе залива.

Если вас интересуют различные карьерные скачки и прорывы в моей карьере, ознакомьтесь с этими сериями:

  • 👩🏻‍💻 🔥Hot-Takes🔥 Мики на MLE-интервью: типы ролей и подготовка к интервью — Часть 1 и Часть 2 — Где я рассказываю о получении моей роли (которая изначально была ML Engineering до того, как команда перешла на MLOps) )
  • ✂️Взрыв в науку о данных - от парикмахера до специалиста по данным 🔍 — Часть 1, Часть 2, Часть 3, Часть 4 — где я подробно рассказываю о подготовке к работе в качестве специалиста по данным. ученый.

Если вам интересно узнать больше о MLOps, производственном машинном обучении и распределенных системах + облачной разработке, я также публикую:

  • Видео на Youtube на сайте The MLOps Engineer
  • Технические пошаговые руководства по Подстеку
  • Снарк и соленость в Твиттере
  • Профессиональное звучание/карьерно-ориентированный материал на LinkedIn
  • Списки кода и TODO на Github

А я принимаю поддержку и покровительство в виде кофе ☕!