В этой статье обсуждается автоматизированное машинное обучение и сокращение времени на получение точной информации с помощью минимального кода. От основ того, чем на самом деле является автоматизированное машинное обучение, до вариантов его использования, здесь объясняются различные алгоритмы и множество других служб и технических тем для автоматизированного машинного обучения Azure.

Автоматизированное машинное обучение

Автоматизированное машинное обучение (Auto ML) относится к автоматизации процесса разработки модели машинного обучения, который в основном является итеративным и требует чрезвычайно много времени, что позволяет разработчикам, аналитикам и специалистам по данным создавать масштабируемые, эффективные и продуктивные модели машинного обучения. Azure предоставляет функцию Auto ML, которая упрощает получение готовых к использованию моделей машинного обучения, не тратя много времени. Десятки моделей могут быть созданы и одновременно сравнены с точными моделями, которые будут выбраны для использования.

Варианты использования автоматизированного машинного обучения

Auto ML в основном используется, когда нам нужно определить порог точности целевого показателя для нашей модели, что позволяет нам делать машинное обучение Azure путем обучения и настройки моделей с использованием множества различных алгоритмов параллельно.

Azure Auto ML демократизировал использование инструментов машинного обучения независимо от опыта людей, выполняющих решения, и помог, предоставив сквозной конвейер машинного обучения для целого ряда проблем, которые необходимо решить.

Классификация

Классификация — это один из контролируемых подходов к обучению для классификации данных в определенную категорию. Система классификации данных на спам, обнаружение мошенничества, обнаружение объектов обычно являются проблемами классификации.

Регрессия

В отличие от классификации, регрессия — это процесс построения взаимосвязи между переменными для прогнозирования непрерывного значения. Его можно разбить на линейную и логистическую регрессию.

Чтобы узнать об этих различных регрессиях и их примерах с использованием программирования на R, ознакомьтесь с предыдущей статьей Обработка данных и визуализация в R.

Прогноз

В машинном обучении прогноз в основном делается на временных рядах с прогнозированием многочисленных бизнес-показателей, начиная от доходов, продаж, требований клиентов, продаж и т. д. Таким образом, они широко используются для прогнозирования спроса, продаж и так далее.

Пример сценария

Рассмотрим, как спрогнозировать стоимость дома. Эта цена будет зависеть от различных характеристик дома в зависимости от местоположения, размера, года постройки, используемых материалов, удобств и многого другого. Для этого нам понадобится набор данных о других домах и их ценах с различными функциями, чтобы обучить модель на основе этих данных и извлечь из них уроки.

Некоторые из примеров набора данных домов будут содержать данные о таких функциях, как:

  • Функции
  • Место расположения
  • Размер
  • Год постройки
  • Используемые материалы
  • Удобства
  • Общее количество комнат
  • Общее количество ванн
  • Общее количество половинных ванн
  • Общее количество доступных парковок
  • Размер сада

Теперь для автоматизированного машинного обучения мы выберем алгоритм для запуска. В зависимости от необходимости мы выбираем алгоритм. Некоторые из примеров широко используемых:

Алгоритмы

Усиление градиента

Gradient Boosting обычно использует деревья решений для решения проблем, связанных с классификацией и регрессией. Это метод машинного обучения, который используется для создания моделей прогнозирования с использованием наилучшей следующей модели в сочетании с предыдущими моделями с верой в уменьшение ошибки прогнозирования.

Ближайший сосед

Алгоритм ближайшего соседа помогает решить аппроксимацию задачи коммивояжера. Алгоритм k-ближайшего соседа широко используется для задач регрессии и классификации.

Машина опорных векторов (SVM)

Машина опорных векторов — это алгоритм, который помогает анализировать данные для регрессионного и классификационного анализа и представляет собой модель обучения с учителем. Его можно использовать для решения как линейных, так и нелинейных задач классификации. Алгоритм кластеризации опорных векторов является расширением SVM, который представляет собой неконтролируемый подход к категоризации неразмеченных данных и широко используется сегодня в отрасли.

Байесовская регрессия

Байесовская линейная регрессия использует статистический анализ байесовского вывода для решения с подходом к линейной регрессии. В отличие от одной лишь линейной регрессии, в которой используется значение точечной оценки, байесовская регрессия использует для своего подхода распределение вероятностей.

Градиентный спуск

Алгоритм градиентного спуска помогает найти локальный минимум дифференцируемой функции с помощью метода итерационной оптимизации первого порядка. Он использует подход, заключающийся в выполнении итерационных шагов в обратном направлении градиента функции в текущей точке, поскольку это направление наискорейшего спуска. Его можно понимать как алгоритм оптимизации, основанный на выпуклой функции. Это часто происходит на этапе обратного распространения при работе с нейронной сетью для минимизации функции стоимости.

ЛГБМ

Машинный алгоритм с усилением светового градиента (LGBM) широко используется для классификации, ранжирования и многих других задач машинного обучения, который представляет собой высокопроизводительную инфраструктуру с градиентным усилением, основанную на алгоритме дерева решений и быструю, поскольку он обрабатывает с использованием разделения на основе гистограммы, односторонняя выборка на основе градиента (GOSS) и объединение эксклюзивных функций (EFB).

Затем, в зависимости от параметров, мы вычисляем окончательную модель прогнозируемого значения. Некоторые параметры могут быть,

  • Параметры
  • Критерий
  • Потеря
  • Минимальное количество сэмплов
  • Лист мин. образцов
  • Другие

Мы знаем, что для среднего разработчика/ученого создание модели обычно является трудоемкой задачей. Automated ML поддерживает одновременный запуск всех моделей в течение определенного времени и выбор наиболее точной модели. Это можно сделать в основном в 3 шага.

Шаг 1 — ввод

  • Введите данные
  • Определить цели
  • Применить ограничения

Шаг 2. Интеллектуальное параллельное тестирование нескольких моделей

Шаг 3 — Вывод

  • Оптимизированная модель

Как использовать Azure Auto ML?

Azure Automated Machine Learning и ML Studio — это служба, доступная только в версии Enterprise, в отличие от базовой версии Premium. Вы можете использовать калькулятор цен Azure, чтобы узнать стоимость ежемесячного счета.

Ссылки

Чтобы прочитать полную статью, проверьте ее по адресу: https://bit.ly/3fwF7KS.