Время идет быстро. Несколько лет назад я поделился первой историей машинного обучения о прогнозировании страховых случаев. Он основан на коде Python с алгоритмом логистической регрессии для создания простой модели классификации в качестве демонстрационной цели.

В 2020 году должен наступить год автоматического машинного обучения (Auto ML), чтобы сделать процесс машинного обучения чистым, простым, быстрым и доступным каждому, даже людям, не имеющим знаний в области машинного обучения или науки о данных.

Недавно, в связи с работой, я помогаю своему клиенту исследовать/оценивать решения для платформы обработки данных и машинного обучения. Меня удивляет, что Azure Machine Learning (AML) значительно усовершенствована и действительно предоставляет комплексную платформу решений и заботится о широком круге конечных пользователей, от новичков до экспертов.

В этой серии статей я расскажу о том, как использовать эту платформу обработки данных и машинного обучения (Azure Machine Learning) для различных типов пользователей. Сегодня я хотел бы поделиться самыми интересными (ленивыми 🤣) возможностями Auto ML.

Прежде всего, вам нужно получить бесплатный пробный кредит Azure, а затем выполнить 8 простых шагов из официальной статьи в рабочую область машинного обучения Azure.

Начнем…

Прежде всего, вам нужны некоторые данные, в этой демонстрации я буду использовать классический пример классификации, предсказание диабета. Вы можете легко зайти на Kaggle, чтобы скачать классический набор данных Prima Indians Diabetes Database.

Шаг 1. Загрузите и зарегистрируйте загруженный набор данных в рабочей области.

Щелкните Наборы данных › Создать набор данных › Из локальных файлов.

Дайте имя вашему набору данных, выберите «Таблица» в «Тип набора данных», «Далее».

Нажмите «Обзор», выберите файл набора данных для загрузки, «Далее».

Затем вы можете увидеть предварительный просмотр набора данных, выберите «Использовать заголовок из первого файла» в заголовках столбцов, «Далее».

Он будет автоматически определять схему и тип данных, Далее.

Щелкните Создать, чтобы создать новый набор данных в рабочей области.

Шаг 2. Начните обучение модели AutoML.

Щелкните Automated ML › Новый запуск Automated ML.

Выберите набор данных «диабет», «Далее».

Введите имя эксперимента по своему усмотрению, выберите «Результат» в качестве столбца «Цель» и «Выберите обучающий кластер для запуска обучения модели», «Далее».

Если у вас нет обучающего кластера, нажмите «Создать новое вычисление».

Создайте обучающий кластер, чтобы запустить обучение модели и полностью управлять им, введите имя обучающего кластера в поле Имя вычислений, выберите размер узла обучающего кластера (ЦП или ГП) и максимальное количество узлов для обучения модели.

Нажмите «Классификация» в типе задачи, «Готово». А давайте выпьем кофе и подождем…

Шаг 3. Выберите лучшую модель и разверните ее.

После завершения обучения Auto ML нажмите Run ID.

Вы можете щелкнуть вкладку «Модели», чтобы проверить, какой алгоритм обеспечивает наилучший результат точности. В этом случае он автоматически выберет алгоритм «VotingEnsemble» с соответствующей настройкой гиперпараметров.

Вернитесь на вкладку «Подробности», нажмите «Развернуть лучшую модель».

Введите имя по своему усмотрению, выберите «ACI» в качестве типа вычислений, а затем нажмите «Развернуть».

Машинное обучение Azure поможет вам упаковать модель в образ контейнера, отправить образ в ACR (Реестр контейнеров Azure), а затем использовать ACI (Экземпляр контейнера Azure) для автоматического использования в качестве конечной точки API при любом дальнейшем взаимодействии или настройке.

Щелкните Конечные точки › Конечные точки в реальном времени и щелкните только что созданную конечную точку.

Перейдите на вкладку «Использовать», конечная точка Rest API подготовлена ​​для вас, просто скопируйте и вставьте, и давайте попробуем.

Я использую Postman для простого вызова API. Вставьте конечную точку API и опубликуйте некоторые входные данные для прогнозирования. В случае прогнозирования диабета нам необходимо ввести значения для беременностей, уровня глюкозы, артериального давления, толщины кожи, инсулина, ИМТ, родословной функции диабета и возраста.

Затем вы можете получить результат, в этом примере это положительный случай, и точность должна составлять около 78% на основе текущего набора данных.

Это магия Auto ML 😊.

Надеюсь, вам понравился этот обмен. Давайте попробуем другой тип задачи (регрессия, прогнозирование временных рядов), чтобы решить другие проблемы машинного обучения.

Это только начало. Auto ML лучше всего подходит для новичков и позволяет каждому создавать модели машинного обучения. Машинное обучение Azure (AML) — это комплексная платформа решений для обработки данных и машинного обучения.

В следующей статье я расскажу о промежуточных вещах, возможностях исследования данных и конструктора в Машинном обучении Azure.