Обучите простую модель нейронной сети с помощью Azure

Хотя нейронные сети широко известны для использования в глубоком обучении и моделировании сложных задач, таких как распознавание изображений, они легко адаптируются к задачам регрессии. Любой класс статистических моделей можно назвать нейронной сетью, если они используют адаптивные веса и могут аппроксимировать нелинейные функции своих входных данных. Таким образом, регрессия нейронной сети подходит для задач, решение которых не может быть найдено с помощью более традиционной модели регрессии.

Регрессия нейронной сети - это контролируемый метод обучения, поэтому для него требуется набор данных с тегами, который включает столбец меток. Поскольку регрессионная модель предсказывает числовое значение, столбец метки должен иметь числовой тип данных.

Мы будем использовать подмножество NYC Taxi & Limousine Commission - записи о поездках на зеленом такси, доступные в Azure Open Datasets. Данные дополняются данными о праздниках и погоде. На основе расширенного набора данных мы настроим предварительно созданный модуль регрессии нейронной сети для создания модели регрессии с использованием настраиваемого алгоритма нейронной сети. Мы обучим модель, предоставив модель и набор данных такси Нью-Йорка в качестве входных данных для модели поезда. Обученную модель затем можно использовать для прогнозирования тарифов на такси Нью-Йорка. Все это мы сделаем из конструктора машинного обучения Azure, не написав ни единой строчки кода.

Загрузить набор данных

На портале Azure откройте доступную рабочую область машинного обучения.
Выберите Запустить сейчас под сообщением Попробуйте новую студию машинного обучения Azure.

3. При первом запуске студии может потребоваться указать каталог и подписку.

4. В студии выберите Наборы данных, + Создать набор данных, Из веб-файлов. Откроется диалоговое окно Create dataset from web files справа.

5. В студии выберите Наборы данных, + Создать набор данных, Из веб-файлов. Это откроет Create dataset from web files диалоговое окно справа.

Предварительный просмотр набора данных

На панели «Настройки и предварительный просмотр» установите для заголовков столбцов раскрывающееся значение All files have same headers.
Прокрутите предварительный просмотр данных вправо, чтобы увидеть целевой столбец: totalAmount. По завершении просмотра данных нажмите Далее.

3. Выберите столбцы из набора данных, чтобы включить их в данные для обучения. Оставьте настройки по умолчанию и нажмите Далее.

4. Для создания набора данных подтверждаем сведения о наборе данных и выбираем Создать.

Создание нового конвейера обучения

В студии выберите Дизайнер, +. Это откроет visual pipeline authoring editor.

Настроить вычислительную цель

На панели настроек справа выберите Выбрать цель вычислений.

В редакторе Set up compute target выберите доступное вычисление, а затем выберите Сохранить.

Примечание. Если вы столкнулись с трудностями при доступе к всплывающим окнам или кнопкам в пользовательском интерфейсе, обратитесь к разделу справки в лабораторной среде.

Добавить набор данных

На левой панели навигации выберите раздел Наборы данных. Затем выберите Мои наборы данных, nyc-taxi-sample-data и перетащите выбранный набор данных на холст.

Разделить набор данных

На левой панели навигации выберите раздел Преобразование данных. Следуйте инструкциям, описанным ниже:
Выберите готовый модуль Разделить данные.
Перетащите выбранный модуль на холст.
Доля строк в первом выходном наборе данных: 0,7
Подключите Dataset к модулю Split Data

Обратите внимание, что вы можете отправить конвейер в любой момент для просмотра результатов и действий. Запущенный конвейер также генерирует метаданные, которые доступны для последующих действий, таких как выбор имен столбцов из списка в диалоговых окнах выбора.

Инициализировать регрессионную модель

Выберите раздел Алгоритмы машинного обучения на левой панели навигации. Следуйте инструкциям, описанным ниже:
Выберите готовый модуль Регрессия нейронной сети в категории «Регрессия».
Перетащите выбранный модуль на холст.
Создать режим тренера: Один параметр. Этот параметр указывает, как вы хотите обучать модель.
Спецификация скрытого слоя: Полностью связанный корпус.
Для скорости обучения: 0,01.

Примечание. Поскольку количество узлов на входном слое определяется количеством функций в обучающих данных, в регрессионной модели может быть только один узел на выходном слое.

Настройка модуля модели поезда

На левой панели навигации выберите раздел Обучение модели. Следуйте инструкциям, описанным ниже:
Выберите готовый модуль Модель поезда.
Перетащите выбранный модуль на холст.
Подключите модуль Neural Network Regression к первому входу модуля Train Model.
Подключите первый выход модуля Split Data ко второму входу модуля Train Model.
Щелкните ссылку Изменить столбец, чтобы открыть Label column редактор.

Редактор Label column позволяет указать ваш Label or Target column. Введите название столбца метки totalAmount и выберите Сохранить.

Настроить модуль модели оценки

Выберите раздел Оценка и оценка модели на левой панели навигации. Следуйте инструкциям, описанным ниже:
Выберите готовый модуль Score Model.
Перетащите выбранный модуль на холст.
Подключите модуль Train Model к первому входу модуля Score Model.
Подключите второй выход модуля Split Data ко второму входу модуля Score Model.

Обратите внимание, что модуль Split Data будет передавать данные как для обучения модели, так и для оценки модели. Первый выход (доля 0,7) соединится с модулем Train Model, а второй выход (доля 0,3) будет соединен с модулем Score Model.

Настройка модуля оценки модели

Выберите раздел Оценка и оценка модели на левой панели навигации. Следуйте инструкциям, описанным ниже:
Выберите готовый модуль Evaluate Model.
Перетащите выбранный модуль на холст.
Подключите модуль Score Model к первому входу модуля Evaluate Model.

Отправить обучающий канал

Выберите Отправить, чтобы открыть Setup pipeline run редактор.

В Setup pipeline run editor выберите Эксперимент, Создать и укажите New experiment name: регрессию нейронной сети, а затем выберите Отправить.

Дождитесь завершения работы трубопровода. Для завершения цикла потребуется около 8 минут.

Пока вы ждете завершения обучения модели, вы можете узнать больше об алгоритме обучения, используемом в этой лабораторной работе, выбрав Модуль регрессии нейронной сети.

Визуализируйте прогнозы модели

Выберите Модель оценки, Выходы, Визуализировать, чтобы открыть диалоговое окно Score Model result visualization, или просто щелкните правой кнопкой мыши модуль Score Model и выберите Визуализировать набор данных с оценкой.

Обратите внимание на прогнозируемые значения в столбце Ярлыки с оценками. Вы можете сравнить прогнозируемые значения (Scored Labels) с фактическими значениями (totalAmount).

Визуализируйте результаты оценки

Выберите Оценить модель, Выходные данные, Визуализировать, чтобы открыть Evaluate Model result visualization диалоговое окно, или просто щелкните правой кнопкой мыши модуль Evaluate Model и выберите Визуализировать результаты оценки.

Оцените производительность модели, просмотрев различные показатели оценки, такие как Средняя абсолютная ошибка, Среднеквадратичная ошибка и т. Д.

Следующие шаги

Поздравляю! Вы обучили простую модель нейронной сети, используя предварительно созданный модуль регрессии нейронной сети в визуальном конструкторе AML.