Машинное обучение — горячая тема: выпуск ChatGPT взбудоражил воображение многих. Как искусственный интеллект (ИИ) может помочь нам добиться прогресса в наших организациях? Ваши клиенты могут извлечь выгоду из улучшенных продуктов и услуг, основанных на решениях искусственного интеллекта. Однако о внедрении искусственного интеллекта в ваши операции легче сказать, чем сделать. Общие проблемы включают в себя:

  • Сложность моделей машинного обучения: сложные модели могут быть сложными в обслуживании;
  • Зависимости данных: все мы знаем «мусор на входе, мусор на выходе»;
  • Отсутствие стандартизации: из-за своей новизны в настоящее время не существует универсального метода развертывания моделей машинного обучения;
  • Безопасность: модели машинного обучения часто имеют дело с конфиденциальными данными;
  • Масштабируемость: работа с растущим числом моделей ИИ и источников данных все усложняет.

Операции машинного обучения (MLOps) — это набор методов, направленных на оптимизацию разработки, развертывания и обслуживания моделей машинного обучения в производственной среде.

В UbiOps мы специализируемся на том, чтобы помочь вам запустить ваши модели ИИ в облаке мгновенно, легко и в любом масштабе. MLOps — это наш хлеб с маслом, и мы постоянно ищем новые интересные статьи в этой области. Ниже мы представляем десять статей от экспертов в этой области, которые, по нашему мнению, вам следует прочитать, если вы хотите ознакомиться с MLOps.

Зачем читать эти (MLOPs) статьи?

Если вы заинтересованы во внедрении ИИ в свою организацию или вам просто интересно узнать больше о том, чем занимаются другие, эти десять документов станут отличной основой для вашего путешествия в MLOps. Прочитав их, вы получите хорошее целостное представление о MLOps, будете знакомы с распространенными ловушками и получите представление о том, с чего начать, если хотите, чтобы MLOps стали частью вашей деятельности. Вот список:

— — — — — — — — — — — — –

  1. Операции машинного обучения (MLOPs): обзор, определение и архитектура

Доминик Кройцбергер и др.

MLOps — это общий термин. Он охватывает множество различных областей знаний, которые требуют различных технических компонентов и обязанностей в вашей организации. В этой статье Доминик Кройцбергер и соавт. представить девять принципов MLOps. Они также объясняют многочисленные технические компоненты, обязанности, рабочие процессы и то, как все это взаимодействует. Понимание их блок-схемы MLOps определенно даст вам отличное представление о том, как организовать вашу организацию для работы с ИИ. Однако это может быть немного ошеломляющим, поскольку они действительно пытаются охватить все основы. Но не беспокойтесь об этом, мы обещаем, что это будет иметь смысл, когда вы погрузитесь глубже.

Полный текст статьи вы можете найти здесь.

— — — — — — — — — — — — –

2. Проблемы внедрения машинного обучения: обзор примеров из практики

Андрей Палейес, Рауль-Габриэль Урма, Нил Д. Лоуренс

MLOps имеет много движущихся частей, и каждая из этих частей имеет свой собственный набор проблем и соображений. Следовательно, знакомство с этими проблемами поможет вам понять, на что следует обратить внимание при разработке конвейеров MLOps. В этой статье обсуждаются соображения, проблемы и опасения для всех этапов развертывания машинного обучения на основе тематических исследований, проведенных реальными компаниями. Среди прочего, они обсуждают управление данными, вычислительные затраты и безопасность. Не нужно изобретать велосипед, если вы можете учиться у тех, кто был до вас, верно?

Полный текст статьи вы можете найти здесь.

— — — — — — — — — — — — –

3. Ease.ML: система управления жизненным циклом для машинного обучения

Леонель Агилар и др.

Как я уже отмечал в первой статье этого списка, начало работы с приложениями машинного обучения может оказаться сложной задачей. Процесс Ease.ML — это система, позволяющая неспециалистам делать именно это! Это целостный подход к разработке приложений машинного обучения. С помощью пошагового руководства Ease.ML поможет вам с нуля до развернутой модели с определенными гарантиями качества. Если вы знаете, как обращаться со своим набором данных, можете писать простые скрипты на Python и понимаете основные концепции машинного обучения, вы готовы к работе. Ваши первые проекты не будут сложными, но они станут хорошей основой для расширения.

Полный текст статьи вы можете найти здесь.

— — — — — — — — — — — — –

4. Создание служб непрерывной интеграции для машинного обучения

Боян Карлаш и др.

Непрерывная интеграция (CI) некоторое время была основной функцией DevOps для разработки промышленного программного обеспечения. Это помогает обеспечить интеграцию и регулярное тестирование изменений, внесенных несколькими разработчиками. В идеале, в ближайшем будущем MLOps достигнет той же зрелости, что и DevOps. К сожалению, фреймворк DevOps нельзя скопировать и вставить в решения для машинного обучения. Непрерывная интеграция требует, среди прочего, непрерывной работы с наборами данных. Но исследования показали, что точность тестового набора данных снижается, когда к нему обращаются снова и снова. Для MLOps особенно важно не допустить этого, потому что плохой набор тестов приводит к плохо подобранным моделям машинного обучения. Поэтому в этой статье обсуждаются два изменения в структуре DevOps, чтобы заставить ее работать для машинного обучения: вероятностное тестирование программного обеспечения вместо детерминированного и обновление набора данных для предотвращения влияния ослабленных данных на модель. Кроме того, в этом документе обсуждается, как реализовать систему CI, которая включает эти функции.

Полный текст статьи вы можете найти здесь.

— — — — — — — — — — — — –

5. Управление активами в машинном обучении: опрос

Сэмюэл Идову, Даниэль Штрюбер, Торстен Бергер

Разработка приложений машинного обучения — это итеративный процесс. У вас будет много разных моделей с разными архитектурами и гиперпараметрами, при этом вы будете постоянно использовать разные наборы данных и генерировать различную статистику. Это называется активами ML, и за ними нужно следить! Какими типами активов ML вам нужно управлять? Какие инструменты существуют, чтобы помочь вам в этом? Как вы можете интегрировать эти инструменты в свои системы разработки машинного обучения? Прочитайте этот опрос, чтобы узнать!

Полный текст статьи вы можете найти здесь.

— — — — — — — — — — — — –

6. Создание воспроизводимого конвейера машинного обучения

Питер Сугимура, Флориан Хартл

Воспроизводимость является важным качеством любой итерационной системы. По этой причине важно уметь количественно оценивать изменения и улучшения. В машинном обучении это означает, что модель должна каждый раз выдавать один и тот же результат при одних и тех же входных данных. В этой статье обсуждаются несколько причин проблем воспроизводимости и представлены возможные решения. Они обсуждают свой конвейер моделирования и его различные уровни, специально разработанные для создания надежной модели машинного обучения.

Полный текст статьи вы можете найти здесь.

— — — — — — — — — — — — –

7. Как избежать ловушек машинного обучения: руководство для ученых-исследователей

Майкл А. Лоунс

Новички в любой области, как правило, делают одни и те же ошибки. Это руководство предназначено для студентов и других исследователей, которые плохо знакомы с машинным обучением. Он классифицирует ошибки по разным частям разработки: анализ данных, построение модели машинного обучения, оценка и сравнение различных моделей. Затем для каждой категории они обсуждают некоторые важные правила, которые научат вас избегать ошибок! Из-за целевой аудитории эту статью легко читать, если у вас уже есть какие-то знания в области машинного обучения.

Полный текст статьи вы можете найти здесь.

— — — — — — — — — — — — –

8. Инжиниринг данных для анализа данных: классификация проблем и примеры из практики

Альфредо Назабаль и др.

Выходные данные модели машинного обучения настолько хороши, насколько хороши ее входные данные. Таким образом, важным шагом является подготовка данных для процесса обучения модели. Непонимание данных, их неправильная очистка или получение из неподходящих мест быстро завершат ваш проект машинного обучения без каких-либо презентабельных результатов. Такая подготовка называется проектированием данных, и в этой статье конкретно обсуждается, как выполнить эту задачу для создания высококачественных входных данных для машинного обучения.

Полный текст статьи вы можете найти здесь.

— — — — — — — — — — — — –

9. Представление MLOps на основе качества данных

Седрик Ренггли и др.

Как неверные данные распространяются через систему машинного обучения? Как вы оцениваете вероятность создания успешного приложения машинного обучения? С помощью четырех примеров вы прочтете, как очистить данные, выполнить технико-экономическое обоснование, оценив частоту байесовских ошибок для вашей задачи машинного обучения, и как организовать эффективную систему проверки качества. Эти процессы влияют как на предтренировочный, так и на послетренировочный этапы MLOps. Таким образом, понимание этого убережет вас от многих бесплодных усилий.

Полный текст статьи вы можете найти здесь.

— — — — — — — — — — — — –

10. На пути к автоматизации жизненного цикла операций ИИ

Мэтью Арнольд и др.

Начало работы с вашим приложением ML требует много ручной работы. Вам нужно много знаний и человеческого взаимодействия с вашими системами для подготовки данных, разработки модели машинного обучения и ее обслуживания. По этой причине в идеале большая часть обслуживания, необходимого после развертывания, выполняется автоматически. В этой статье представлены некоторые технологии, которые помогут вам работать именно в этом направлении. Автоматизация может быть сложной в настройке, но когда она работает, она сэкономит вам много времени, усилий и денег.

Полный текст статьи вы можете найти здесь.