В этой статье обсуждается автоматизированное машинное обучение и сокращение времени на получение точной информации с помощью минимального кода. От основ того, чем на самом деле является автоматизированное машинное обучение, до вариантов его использования, здесь объясняются различные алгоритмы и множество других служб и технических тем для автоматизированного машинного обучения Azure.
Автоматизированное машинное обучение
Автоматизированное машинное обучение (Auto ML) относится к автоматизации процесса разработки модели машинного обучения, который в основном является итеративным и требует чрезвычайно много времени, что позволяет разработчикам, аналитикам и специалистам по данным создавать масштабируемые, эффективные и продуктивные модели машинного обучения. Azure предоставляет функцию Auto ML, которая упрощает получение готовых к использованию моделей машинного обучения, не тратя много времени. Десятки моделей могут быть созданы и одновременно сравнены с точными моделями, которые будут выбраны для использования.
Варианты использования автоматизированного машинного обучения
Auto ML в основном используется, когда нам нужно определить порог точности целевого показателя для нашей модели, что позволяет нам делать машинное обучение Azure путем обучения и настройки моделей с использованием множества различных алгоритмов параллельно.
Azure Auto ML демократизировал использование инструментов машинного обучения независимо от опыта людей, выполняющих решения, и помог, предоставив сквозной конвейер машинного обучения для целого ряда проблем, которые необходимо решить.
Классификация
Классификация — это один из контролируемых подходов к обучению для классификации данных в определенную категорию. Система классификации данных на спам, обнаружение мошенничества, обнаружение объектов обычно являются проблемами классификации.
Регрессия
В отличие от классификации, регрессия — это процесс построения взаимосвязи между переменными для прогнозирования непрерывного значения. Его можно разбить на линейную и логистическую регрессию.
Чтобы узнать об этих различных регрессиях и их примерах с использованием программирования на R, ознакомьтесь с предыдущей статьей Обработка данных и визуализация в R.
Прогноз
В машинном обучении прогноз в основном делается на временных рядах с прогнозированием многочисленных бизнес-показателей, начиная от доходов, продаж, требований клиентов, продаж и т. д. Таким образом, они широко используются для прогнозирования спроса, продаж и так далее.
Пример сценария
Рассмотрим, как спрогнозировать стоимость дома. Эта цена будет зависеть от различных характеристик дома в зависимости от местоположения, размера, года постройки, используемых материалов, удобств и многого другого. Для этого нам понадобится набор данных о других домах и их ценах с различными функциями, чтобы обучить модель на основе этих данных и извлечь из них уроки.
Некоторые из примеров набора данных домов будут содержать данные о таких функциях, как:
- Функции
- Место расположения
- Размер
- Год постройки
- Используемые материалы
- Удобства
- Общее количество комнат
- Общее количество ванн
- Общее количество половинных ванн
- Общее количество доступных парковок
- Размер сада
Теперь для автоматизированного машинного обучения мы выберем алгоритм для запуска. В зависимости от необходимости мы выбираем алгоритм. Некоторые из примеров широко используемых:
Алгоритмы
Усиление градиента
Gradient Boosting обычно использует деревья решений для решения проблем, связанных с классификацией и регрессией. Это метод машинного обучения, который используется для создания моделей прогнозирования с использованием наилучшей следующей модели в сочетании с предыдущими моделями с верой в уменьшение ошибки прогнозирования.
Ближайший сосед
Алгоритм ближайшего соседа помогает решить аппроксимацию задачи коммивояжера. Алгоритм k-ближайшего соседа широко используется для задач регрессии и классификации.
Машина опорных векторов (SVM)
Машина опорных векторов — это алгоритм, который помогает анализировать данные для регрессионного и классификационного анализа и представляет собой модель обучения с учителем. Его можно использовать для решения как линейных, так и нелинейных задач классификации. Алгоритм кластеризации опорных векторов является расширением SVM, который представляет собой неконтролируемый подход к категоризации неразмеченных данных и широко используется сегодня в отрасли.
Байесовская регрессия
Байесовская линейная регрессия использует статистический анализ байесовского вывода для решения с подходом к линейной регрессии. В отличие от одной лишь линейной регрессии, в которой используется значение точечной оценки, байесовская регрессия использует для своего подхода распределение вероятностей.
Градиентный спуск
Алгоритм градиентного спуска помогает найти локальный минимум дифференцируемой функции с помощью метода итерационной оптимизации первого порядка. Он использует подход, заключающийся в выполнении итерационных шагов в обратном направлении градиента функции в текущей точке, поскольку это направление наискорейшего спуска. Его можно понимать как алгоритм оптимизации, основанный на выпуклой функции. Это часто происходит на этапе обратного распространения при работе с нейронной сетью для минимизации функции стоимости.
ЛГБМ
Машинный алгоритм с усилением светового градиента (LGBM) широко используется для классификации, ранжирования и многих других задач машинного обучения, который представляет собой высокопроизводительную инфраструктуру с градиентным усилением, основанную на алгоритме дерева решений и быструю, поскольку он обрабатывает с использованием разделения на основе гистограммы, односторонняя выборка на основе градиента (GOSS) и объединение эксклюзивных функций (EFB).
Затем, в зависимости от параметров, мы вычисляем окончательную модель прогнозируемого значения. Некоторые параметры могут быть,
- Параметры
- Критерий
- Потеря
- Минимальное количество сэмплов
- Лист мин. образцов
- Другие
Мы знаем, что для среднего разработчика/ученого создание модели обычно является трудоемкой задачей. Automated ML поддерживает одновременный запуск всех моделей в течение определенного времени и выбор наиболее точной модели. Это можно сделать в основном в 3 шага.
Шаг 1 — ввод
- Введите данные
- Определить цели
- Применить ограничения
Шаг 2. Интеллектуальное параллельное тестирование нескольких моделей
Шаг 3 — Вывод
- Оптимизированная модель
Как использовать Azure Auto ML?
Azure Automated Machine Learning и ML Studio — это служба, доступная только в версии Enterprise, в отличие от базовой версии Premium. Вы можете использовать калькулятор цен Azure, чтобы узнать стоимость ежемесячного счета.
Ссылки
- https://learning.postman.com/docs/sending-requests/visualizer/
- https://www.coursera.org/learn/machine-learning
- https://nlp.stanford.edu/IR-book/html/htmledition/support-vector-machines-the-linearly-separable-case-1.html
Чтобы прочитать полную статью, проверьте ее по адресу: https://bit.ly/3fwF7KS.