Вот некоторые из моих ярких моментов с Саммита прикладного машинного обучения Google Cloud:

  • Используйте обучение с подкреплением для оптимизации долгосрочных показателей
  • Vertex AI для вашего полного конвейера машинного обучения
  • Тенденции в машинном обучении

Используйте обучение с подкреплением для оптимизации долгосрочных показателей

Руководитель службы машинного обучения Spotify Тони Джебара объяснил, как Spotify хотят оптимизировать свой сервис, чтобы пользователи продолжали пользоваться им через много месяцев.

Многие модели машинного обучения будут оптимизированы для более краткосрочных сценариев. В Spotify они могут выстраивать в очередь определенные песни, которые, как они знают, вам уже нравятся, но со временем они вам, вероятно, надоест. Они хотят познакомить вас с новыми исполнителями и песнями, которые углубят их отношения с вами и удержат вас в их служении. Обучение с подкреплением, по-видимому, отлично подходит для этого, поскольку вы можете создать свои функции вознаграждения, чтобы оптимизировать их для долгосрочного счастья.

Spotify анализирует пути пользователя для их самых счастливых пользователей: как пользователь слушает разные треки / станции / подкасты, как они переключаются между ними и повторно взаимодействуют с сервисом и т. Д.

Они используют эти путешествия в качестве обучающих данных для создания своих моделей, которые могут предлагать аналогичные путешествия пользователям, которые не так активно использовали сервис.

Трудно понять, как реальные пользователи отреагируют на новые модели, поэтому Spotify имитирует ожидаемое поведение пользователя (это «агент», выполняющий действия) и использует их для тестирования своих новых политик перед их выпуском в производство. как A / B-тесты.

Было интересно услышать об этом варианте использования обучения с подкреплением!

Vertex AI для вашего полного конвейера машинного обучения

В мае 2021 года Google запустил Vertex AI, который представляет собой набор инструментов, позволяющих управлять наборами данных, создавать, обучать и настраивать модели, развертывать их в производственной среде и контролировать их производительность.

Вы можете обучить свою модель с помощью AutoML (где он вычисляет все, что вам нужно, без необходимости знать почти что-либо о машинном обучении), или вы можете создавать собственные модели с нуля.

Я несколько раз видел демонстрацию AutoML на предыдущих мероприятиях Google I / Os, поэтому мне было очень интересно увидеть, что он, похоже, также поддерживает табличные и текстовые наборы данных.

Большинство демонстраций AutoML, которые я видел, обычно содержат примеры классификации изображений, на которые интересно смотреть, но я подозреваю, что они менее полезны для профессиональных инженеров-программистов, чем решение реалистичных табличных / текстовых задач.

В Документах AutoML Vertex AI говорится, что для табличных данных он поддерживает модели регрессии, модели классификации и модели прогнозирования, что звучит очень полезно.

У AWS есть аналогичные AI Services, в том числе SageMaker AutoPilot, который предлагает возможность AutoML для табличных данных, Amazon Forecast для прогнозирования и многие другие.

Мне было бы очень интересно узнать, насколько успешны эти продукты AutoML в реальных наборах данных, и есть ли какие-либо существенные различия между большими облачными платформами.

Тенденции в машинном обучении

В заключительном выступлении говорилось об общих тенденциях, таких как:

  • Более крупные и лучшие библиотеки компонентов, которые можно комбинировать.
  • Сокращение ручных усилий: позвольте инструментам выполнить настройку гиперпараметров за вас или даже использовать AutoML, чтобы выполнить всю машинную обработку за вас.
  • Использование облака для массового параллельного обучения и конвейеров машинного обучения.
  • Развертывание моделей в TensorFlow Lite и TensorFlow.js.

В целом, мне понравилось много разговоров, и мне интересно наблюдать, как быстро развивается область машинного обучения!