AutoML и рост платформ для продвинутого машинного обучения

Google Next 18 показывает, что машинное обучение становится все более удобным для разработчиков - все благодаря AutoML.

TL; DR: Google делает свои предложения машинного обучения более доступными и удобными для разработчиков. Благодаря AutoML в G Cloud (и других платформах машинного обучения) крупные игроки, такие как Google, делают огромные шаги в направлении популяризации и автоматизации машинного обучения.

Машинное обучение и AutoML от Google

В своей презентации «TensorFlow, глубокое обучение и современные сверточные нейронные сети без докторской степени» Мартин Гёрнер продемонстрировал, как инженер-программист может создать сверточную нейронную сеть для распознавания объектов, не имея обширного академического образования.

В частности, Гёрнер показал, как в открытой исследовательской среде в области машинного обучения любой, у кого есть базовая математика университетского уровня (при достаточных усилиях), может учиться самостоятельно и, в конечном итоге, понимать последние и лучшие исследования в области машинного обучения.

Но с выпуском AutoML Google делает еще один шаг, делая машинное обучение немедленно доступным для гораздо более широкой аудитории разработчиков программного обеспечения. Математика не требуется.

Что такое AutoML?

Машинное обучение меняет парадигму традиционного программирования на основе правил. Вместо программирования логики в виде правил разработчик может декларативно предоставить данные и метки в модель машинного обучения, чтобы компьютер сам изучил правила. Конечно, проблема связана с необходимостью разработки хороших моделей обучения, и Google добился значительных успехов в автоматизации этого этапа с помощью AutoML.

AutoML основан на результатах исследовательской работы Google под названием Поиск нейронной архитектуры с обучением с подкреплением. С помощью обучения с подкреплением поиск нейронной архитектуры (NAS) пытается найти оптимальную сетевую архитектуру, подходящую для определенного набора данных. Для тех, кому интересно, этот пост дает как отличный обзор, так и последние результаты исследований в NAS. Архитектура, найденная NAS для небольшого набора данных, может быть применена к аналогичным более крупным с помощью трансферного обучения. Конечным результатом является автоматизация проектирования сетевой архитектуры, которая может работать так же хорошо, если не лучше, чем современные сети, разработанные ведущими исследователями.

Возможности AutoML

Независимо от того, решаете ли вы типичную бизнес-задачу в области компьютерного зрения, создавая интеллектуальные возможности для пользователей или создавая собственные модели машинного обучения вручную, AutoML предлагает огромную ценность.

Доступность машинного обучения

Благодаря своей высокой производительности и удобному дизайну AutoML значительно снижает порог входа для многих типичных сценариев, в которых может применяться машинное обучение. На данный момент Google выпустил AutoML Vision для анализа изображений, AutoML Natural Language для анализа неструктурированного текста и AutoML Translation для динамического перевода между языками.

С AutoML Vision, будь то двоичная классификация или распознавание объектов или что-то среднее между ними, для начала нужно всего лишь загрузить около дюжины образцов изображений (или абзацев текста) с метками на веб-портал. AutoML предоставляет предприятиям возможности машинного обучения для решения определенных типов традиционно сложных и важных бизнес-задач без необходимости нанимать дорогостоящие навыки.

Прототипирование

Поразительная эффективность AutoML может быть чрезвычайно мощной для быстрого и точного создания прототипов при создании пользовательского опыта с использованием ML. Вместо того, чтобы руководить командой специалистов по обработке данных и тратить месяцы на создание архитектуры и настройку моделей, производственные компании теперь могут использовать AutoML для создания моделей, которые достигают почти оптимальной производительности всего за несколько минут. В сочетании с возможностью быстрого развертывания через REST API, продуктовые компании теперь могут экспериментировать с интеллектуальным пользовательским интерфейсом в гораздо более быстром темпе и продвигать инновации продуктов в захватывающих новых углах.

AutoML значительно снижает порог входа для многих типичных сценариев, в которых может применяться машинное обучение.

Бенчмаркинг

AutoML может помочь специалистам по обработке данных установить базовый / целевой уровень производительности при построении пользовательских моделей. По словам компаний, представленных на Next (и других, с которыми мы говорили), AutoML в настоящее время во многих случаях не превосходит модели, созданные вручную, с точки зрения точности. Тем не менее, есть свидетельства того, что AutoML Vision может достигать 95% производительности самой эффективной модели, а для организаций, в которых группы специалистов по науке о данных работают над задачами, где производительность имеет решающее значение, использование AutoML в качестве базового эталона помогает определить направление построения модели. и точная настройка.

Конкуренция

AutoML от Google - не единственный игрок в поиске нейронной архитектуры и, вероятно, не будет дешевым. Реализация NAS с открытым исходным кодом, AutoKeras, обещает предложить тот же набор функций, что и пакет python. Будет интересно увидеть, как производительность и стоимость различаются между различными услугами / пакетами, но я думаю, что в ближайшем будущем мы увидим гораздо больше реализаций NAS в виде пакетов и услуг.

Расширенные платформы машинного обучения на подъеме

Тот факт, что Google создал свою собственную платформу машинного обучения для разработчиков, является сигналом того, что передовые платформы машинного обучения готовятся к прайм-тайм. Но будь то AutoML, AutoKeras от Google или аналогичные платформы, основная цель всех платформ - помочь инженерам (и организациям, занимающимся расширениями) использовать машинное обучение, обеспечивая вспомогательное или даже автоматическое построение моделей. Они также решают общие проблемы в проектах машинного обучения производственного уровня за счет уменьшения количества человеческих ошибок, внедрения и применения передовых методов, обеспечения плавной интеграции с существующей инфраструктурой данных и многого другого. Основным преимуществом использования платформы машинного обучения является возможность упростить процесс применения машинного обучения для решения схожих бизнес-задач и значительно повысить отдачу от вашей команды по анализу данных.

Почти все продвинутые платформы машинного обучения включают в себя автоматизированный статистический анализ и исследовательское обучение в качестве основных функций, но некоторые платформы идут еще дальше. ИИ без драйверов H2O, например, предлагает автоматическое проектирование функций, преобразования, построение модели и интерпретацию машинного обучения. Позиционируемая как Kaggle Grand Masters in a Box, платформа смогла войти в 1% лучших среди всех конкурентов Kaggle, используя нестандартные функции для определенных наборов данных. Продвинутым платформам машинного обучения еще предстоит пройти долгий путь, прежде чем они смогут надежно автоматизировать машинное обучение в производственной среде, но они представляют собой захватывающее достижение, которое делает машинное обучение более доступным для инженеров-программистов.

Последние мысли

Усовершенствованные платформы машинного обучения, такие как AutoML от Google и AI без драйверов H2O, ликвидируют разрыв между передовыми исследованиями машинного обучения и инженерными решениями реальных проблем. Эти платформы делают это, объединяя результаты последних исследований и делая их легко доступными через высокоуровневые абстракции. Мы искренне воодушевлены возможностями, которые они открывают, и с нетерпением ждем возможности построить более умный мир на основе машинного обучения.

Благодаря оптимизированному и автоматизированному построению, обучению и развертыванию моделей лица, решающие проблемы, теперь могут сосредоточиться на сборе и преобразовании данных («инженерия данных»), действиях, которые являются центральными для решения реальных проблем с помощью машинного обучения. Следите за новостями в нашей предстоящей публикации Next ’18 о передовых методах работы с данными и машинного обучения.