Часть 1. Обзор Azure и настройка среды

В этой серии руководств мы рассмотрим полный рабочий процесс развертывания любого локального проекта машинного обучения Python в Microsoft Azure. Надеюсь, после окончания этой серии статей вы сможете хранить данные, обучать, развертывать и, самое главное, управлять жизненным циклом своих моделей и данных.

После работы с Azure я заметил, что они предлагают несколько способов решения одной проблемы. Это полезно в некоторых случаях, но мне потребовалось некоторое время, чтобы наконец настроить трек, над которым я хотел бы работать, после тестирования нескольких способов, предлагаемых Azure.

Вот почему я хотел бы прояснить ситуацию для всех, кто хочет следовать этому руководству. В этой серии статей мы не будем работать с Azure ML Studio, записными книжками Azure или кодом Visual Studio ML для Azure ML. В этой серии статей основное внимание уделяется SDK Python для машинного обучения Azure, и вариант использования будет заключаться в том, что у вас уже есть уже существующий скрипт python (или вы только начали свой проект машинного обучения), и вы бы например, перенести весь рабочий процесс в Azure.

В этой первой части серии мы сделаем краткий обзор предварительных условий, и вы собираетесь настроить все необходимое, чтобы начать работу с нашим проектом.

Получите подписку Azure

Первое, что нам нужно сделать, это получить бесплатную пробную подписку на Azure. Для этого вам необходимо перейти по ссылке: https://azure.microsoft.com/en-us/free/.

Для входа вам понадобится кредитная карта (не волнуйтесь, когда закончится бесплатная пробная версия, они сообщат вам, и с вас будет взиматься плата только в том случае, если вы решите перейти на новую версию).

После создания учетной записи вам необходимо будет войти в систему по следующей ссылке: https://portal.azure.com/#home.

Создать группу ресурсов

Как только вы окажетесь на портале, у вас будет возможность создавать несколько приложений и служб в Azure, что я рекомендую проверить. Однако мы здесь не для этого, мы сначала должны создать группу ресурсов. Группа ресурсов в Azure - это логический контейнер, содержащий связанные ресурсы, которыми вы хотите управлять как группой. У вас есть возможность решить, какой ресурс принадлежит к какой группе ресурсов. Вы должны иметь в виду, что если эта группа ресурсов будет удалена, все, что ей принадлежит, также будет удалено.

Создание рабочей области машинного обучения Azure

Теперь мы должны создать рабочую область машинного обучения. Для этого вам нужно будет найти и выбрать ресурс под названием машинное обучение. В этой рабочей области мы можем хранить данные, которые будут использоваться для обучения нашей модели, а также вести историю всех запусков обучения.

При создании рабочего пространства и настройке его местоположения следует иметь в виду, что не все местоположения содержат виртуальную машину с графическим процессором в качестве целевого объекта вычислений. Также местоположение имеет значение, если вам нужно ввести или вывести много данных, и обычно с вас взимается гораздо больше, когда вам нужно взять данные из облака. Рекомендуется, чтобы там, где вы хотите больше использовать конечные выходные данные, вы должны указать местоположение в формате.

Автоматически после создания рабочей области в ней создается хранилище BLOB-объектов Azure в качестве хранилища данных по умолчанию. Это будет использовано позже в следующих частях руководства.

Создать вычислительный кластер

С этого момента я рекомендую вам войти в систему на https://ml.azure.com/. Таким образом, мы перейдем непосредственно к нашему рабочему пространству машинного обучения, выбрав, над которым мы готовы работать (вы всегда можете переключить свое рабочее пространство изнутри).

Нажав C ompute, вы сможете создать несколько целевых типов вычислений. Для разработки нам понадобятся либо вычислительные экземпляры для стадии разработки, либо вычислительный кластер для более крупных задач, который содержит возможности многоузлового масштабирования.

На вашем локальном компьютере

Что вам теперь нужно сделать на своем локальном компьютере, так это создать виртуальную среду python и установить все необходимые библиотеки, которые вам нужны.

Самый важный из них - azureml-sdk:

pip install azureml-sdk

Теперь, когда мы все настроили, в следующем уроке мы сможем напрямую начать работу с нашим проектом.