В этой статье обсуждается автоматизированное машинное обучение и сокращение времени на получение точной информации…

В этой статье обсуждается автоматизированное машинное обучение и сокращение времени на получение точной информации с помощью минимального кода. От основ того, чем на самом деле является автоматизированное машинное обучение, до вариантов его использования, здесь объясняются различные алгоритмы и множество других служб и технических тем для автоматизированного машинного обучения Azure.

Автоматизированное машинное обучение

Автоматизированное машинное обучение (Auto ML) относится к автоматизации процесса разработки модели машинного обучения, который в основном является итеративным и требует чрезвычайно много времени, что позволяет разработчикам, аналитикам и специалистам по данным создавать масштабируемые, эффективные и продуктивные модели машинного обучения. Azure предоставляет функцию Auto ML, которая упрощает получение готовых к использованию моделей машинного обучения, не тратя много времени. Десятки моделей могут быть созданы и одновременно сравнены с точными моделями, которые будут выбраны для использования.

Варианты использования автоматизированного машинного обучения

Auto ML в основном используется, когда нам нужно определить порог точности целевого показателя для нашей модели, что позволяет нам делать машинное обучение Azure путем обучения и настройки моделей с использованием множества различных алгоритмов параллельно.

Azure Auto ML демократизировал использование инструментов машинного обучения независимо от опыта людей, выполняющих решения, и помог, предоставив сквозной конвейер машинного обучения для целого ряда проблем, которые необходимо решить.

Классификация

Классификация — это один из контролируемых подходов к обучению для классификации данных в определенную категорию. Система классификации данных на спам, обнаружение мошенничества, обнаружение объектов обычно являются проблемами классификации.

Регрессия

В отличие от классификации, регрессия — это процесс построения взаимосвязи между переменными для прогнозирования непрерывного значения. Его можно разбить на линейную и логистическую регрессию.

Чтобы узнать об этих различных регрессиях и их примерах с использованием программирования на R, ознакомьтесь с предыдущей статьей Обработка данных и визуализация в R.

Прогноз

В машинном обучении прогноз в основном делается на временных рядах с прогнозированием многочисленных бизнес-показателей, начиная от доходов, продаж, требований клиентов, продаж и т. д. Таким образом, они широко используются для прогнозирования спроса, продаж и так далее.

Пример сценария

Рассмотрим, как спрогнозировать стоимость дома. Эта цена будет зависеть от различных характеристик дома в зависимости от местоположения, размера, года постройки, используемых материалов, удобств и многого другого. Для этого нам понадобится набор данных о других домах и их ценах с различными функциями, чтобы обучить модель на основе этих данных и извлечь из них уроки.

Некоторые из примеров набора данных домов будут содержать данные о таких функциях, как:

Функции
Место расположения
Размер
Год постройки
Используемые материалы
Удобства
Общее количество комнат
Общее количество ванн
Общее количество половинных ванн
Общее количество доступных парковок
Размер сада

Теперь для автоматизированного машинного обучения мы выберем алгоритм для запуска. В зависимости от необходимости мы выбираем алгоритм. Некоторые из примеров широко используемых:

Алгоритмы

Усиление градиента

Gradient Boosting обычно использует деревья решений для решения проблем, связанных с классификацией и регрессией. Это метод машинного обучения, который используется для создания моделей прогнозирования с использованием наилучшей следующей модели в сочетании с предыдущими моделями с верой в уменьшение ошибки прогнозирования.

Ближайший сосед

Алгоритм ближайшего соседа помогает решить аппроксимацию задачи коммивояжера. Алгоритм k-ближайшего соседа широко используется для задач регрессии и классификации.

Машина опорных векторов (SVM)

Машина опорных векторов — это алгоритм, который помогает анализировать данные для регрессионного и классификационного анализа и представляет собой модель обучения с учителем. Его можно использовать для решения как линейных, так и нелинейных задач классификации. Алгоритм кластеризации опорных векторов является расширением SVM, который представляет собой неконтролируемый подход к категоризации неразмеченных данных и широко используется сегодня в отрасли.

Байесовская регрессия

Байесовская линейная регрессия использует статистический анализ байесовского вывода для решения с подходом к линейной регрессии. В отличие от одной лишь линейной регрессии, в которой используется значение точечной оценки, байесовская регрессия использует для своего подхода распределение вероятностей.

Градиентный спуск

Алгоритм градиентного спуска помогает найти локальный минимум дифференцируемой функции с помощью метода итерационной оптимизации первого порядка. Он использует подход, заключающийся в выполнении итерационных шагов в обратном направлении градиента функции в текущей точке, поскольку это направление наискорейшего спуска. Его можно понимать как алгоритм оптимизации, основанный на выпуклой функции. Это часто происходит на этапе обратного распространения при работе с нейронной сетью для минимизации функции стоимости.

ЛГБМ

Машинный алгоритм с усилением светового градиента (LGBM) широко используется для классификации, ранжирования и многих других задач машинного обучения, который представляет собой высокопроизводительную инфраструктуру с градиентным усилением, основанную на алгоритме дерева решений и быструю, поскольку он обрабатывает с использованием разделения на основе гистограммы, односторонняя выборка на основе градиента (GOSS) и объединение эксклюзивных функций (EFB).

Затем, в зависимости от параметров, мы вычисляем окончательную модель прогнозируемого значения. Некоторые параметры могут быть,

Параметры
Критерий
Потеря
Минимальное количество сэмплов
Лист мин. образцов
Другие

Мы знаем, что для среднего разработчика/ученого создание модели обычно является трудоемкой задачей. Automated ML поддерживает одновременный запуск всех моделей в течение определенного времени и выбор наиболее точной модели. Это можно сделать в основном в 3 шага.

Шаг 1 — ввод

Введите данные
Определить цели
Применить ограничения

Шаг 2. Интеллектуальное параллельное тестирование нескольких моделей

Шаг 3 — Вывод

Оптимизированная модель

Как использовать Azure Auto ML?

Azure Automated Machine Learning и ML Studio — это служба, доступная только в версии Enterprise, в отличие от базовой версии Premium. Вы можете использовать калькулятор цен Azure, чтобы узнать стоимость ежемесячного счета.

Ссылки

Чтобы прочитать полную статью, проверьте ее по адресу: https://bit.ly/3fwF7KS.