AWS Sagemaker Canvas — отличный вариант с простым и удобным пользовательским интерфейсом для машинного обучения с минимальным кодом или без него. (Пожалуйста, ознакомьтесь с некоторыми из предыдущих сообщений о других интеграциях Snowflake + Sagemaker.) Недавно AWS Sagemaker расширил свои возможности, чтобы поддерживать настоящий опыт AutoML для гражданских специалистов по данным, которые могут предпочесть способ без кода. для создания моделей машинного обучения с помощью SageMaker Canvas.

Используя SageMaker Canvas, бизнес-аналитики теперь могут самостоятельно создавать модели машинного обучения и генерировать прогнозы, импортируя любой набор данных из своих учетных записей Snowflake и определяя модель, которую они хотели бы обучить, несколькими щелчками мыши. Мы также можем генерировать одиночные и пакетные прогнозы и поддерживать разные версии модели без написания единой строки кода.

Вот шаги для простой демонстрации создания модели ML для прогнозирования оттока клиентов с использованием набора данных в Snowflake с использованием Sagemaker Canvas:

1. Импортируйте свои наборы данных из своей учетной записи Snowflake с помощью интеграции хранилища

Выберите Наборы данных на левой боковой панели и нажмите кнопку Импорт, чтобы импортировать данные из Snowflake:

Нажмите Добавить соединение на странице импорта и выберите Snowflake в раскрывающемся меню:

Добавьте информацию о подключении Snowflake к существующей интеграции хранилища (обычно определяемой администраторами Snowflake — см. Интеграция хранилища в Snowflake), определенной, как показано в примере ниже, и нажмите Добавить подключение.

После успешного подключения теперь вы можете перетаскивать таблицы Snowflake, содержащие исходные данные, для подготовки набора обучающих данных и, при необходимости, создания простых преобразований либо без использования одной строки кода, либо просто с использованием SQL, как показано ниже.

Когда все будет хорошо, вы можете нажать кнопку Импортировать данные и сохранить набор данных, указав имя набора данных.

2. Обучите свою модель

После того, как набор данных будет готов, вы можете использовать функцию AutoML для обучения своей модели, щелкнув «Модели» слева, нажав кнопку +Новая модель и указав имя для своей модели (например, churn_demo). :

В конфигурации AutoML выберите ранее созданный набор данных:

Теперь нажмите на вкладку «Сборка» и выберите целевое поле, которое вы хотите предсказать (в нашем случае это поле RETAINED) в вашем наборе данных.

Sagemaker Canvas автоматически определяет, какую модель лучше всего использовать (временной ряд, регрессия и классификация и т. д.). Вы всегда можете нажать «Изменить тип» и выбрать тип модели по вашему выбору.

Мы выбираем модель 2 категорий (двоичная классификация) для прогнозирования поля RETAINED для каждой записи клиента в наборе данных. После этого нажимаем Изменить тип:

Теперь, когда все настроено, мы можем нажать Предварительный просмотр модели, который генерирует анализ для оценки прогнозируемой точности, если бы мы построили эту модель, а также выводы о важности функций (это займет пару минут) :

Теперь мы можем нажать Быстрая сборка и начать сборку модели:

Через 2–15 минут статус модели отображается в разделе «Анализ», и наша модель успешно построена и развернута для поддержки прогнозов:

Вы также можете создавать разные версии одной и той же модели по мере необходимости.

3. Прогнозирование оттока клиентов

Время прогнозировать! Вы можете использовать пакетное прогнозирование или прогнозирование одной записи на вкладке «Прогнозирование». Вот пример предсказания одной записи:

Вы также можете выбрать любой набор данных в своей учетной записи Snowflake для пакетного прогнозирования, нажав на пакетный прогноз, а затем кнопку Выбрать набор данных:

Вот и все!

Поскольку многие организации включают машинное обучение в свои рабочие нагрузки, AWS Sagemaker Canvas предоставляет бизнес-аналитикам отличную возможность экспериментировать с машинным обучением со своими данными в облаке данных Snowflake, используя множество наборов данных, доступных на Snowflake Marketplace.

Мнения, выраженные в этом посте, являются исключительно моими собственными и не отражают точку зрения или мнение моего работодателя.