Экономьте время и деньги на машинном обучении

Кажется, мы вступили во времена, когда машинное обучение (ML) есть везде, от вашего телефона до стиральной машины. И все же, когда мы говорим с компаниями о применении машинного обучения, дискуссия бесконечно переходит к «технологической усталости». Gartner расскажет о дне разочарования, но большинству неизвестно, что ИИ уже пережил несколько зим, когда люди думали, что это будет тупиковый путь. Итак, куда мы направляемся в настоящее время?

Машинное обучение уже принесло человечеству ошеломляющие достижения. От языковой модели GPT3, с помощью которой можно писать статьи, почти неотличимые от статей, написанных людьми, до обнаружения золотых жил под землей с помощью спутниковых изображений — ценность очевидна. Так почему же организации до сих пор так сильно борются с идеей использования машинного обучения?

Вина за эту технологическую усталость ложится на тех, кто отправляется в пространство машинного обучения без четкой дорожной карты. Эта технология настолько обширна, что если вы будете просто слепо экспериментировать, количество перестановок истощит ваши ресурсы задолго до того, как можно будет получить жизнеспособный конечный продукт. Хотя существует множество причин, по которым проекты машинного обучения заходят в тупик, ниже приведены некоторые шаги в правильном направлении.

Автоматизация существовала со времен самих компьютеров. Кому захочется выполнять рутинные задачи, такие как извлечение данных из отчета для передачи другим отчетам в 5 утра? Боты теперь могут избавить нас от этой рутины и, возможно, от большего. Хитрость заключается в том, чтобы применить автоматизацию и к машинному обучению. Kaggle — это веб-сайт, на котором одновременно проводятся десятки соревнований по машинному обучению. После участия в этих соревнованиях я начал наблюдать закономерности в подходе к задачам машинного обучения. Итак, если закономерность можно различить, то, вероятно, ее можно автоматизировать.

Войдите в мир автоматизированного машинного обучения (AutoML). Со временем люди усовершенствовали методы, которые они использовали для успешного решения различных проблем машинного обучения. Вы могли бы пройти сотни этих техник самостоятельно, но я думаю, что мы все предпочли бы, чтобы машина тащилась через все это. Затем предоставьте нам результат, с хорошим отчетом, чтобы показать, как он сделал эти выводы из предоставленных данных. Давайте разберем общие задачи для большинства инициатив в области науки о данных:

1. Очистка данных. Звучит просто, но удаление всех этих смайликов из чата, чтобы ML мог их обработать, может вызвать у большинства программистов кошмары. AutoML может очистить данные за вас, что обычно занимает 70% человеческих усилий в проекте ML. Эта работа, как правило, довольно кропотливая и подвержена ошибкам.

2. Выберите свое оружие. Алгоритмов достаточно, чтобы написать короткую энциклопедию. Итак, какой из них вы выберете? Опять же, есть много нюансов в выборе правильного алгоритма для работы. AutoML может циклически перебирать множество наиболее распространенных алгоритмов, доступных для определенного класса задач, и даже ранжировать их для вас.

3. Настройка алгоритмов. Некоторые люди спрашивали меня, почему мы не можем попробовать все возможные параметры, управляющие алгоритмами, чтобы найти тот, который дает наилучший результат. Как правило, это невозможно, потому что это заняло бы больше времени, чем у большинства из нас на этой земле. Кроме того, каждое выполнение этих требовательных алгоритмов машинного обучения стоит денег с точки зрения оборудования премиум-класса. AutoML помогает, используя советы и приемы, используемые экспертами по машинному обучению в различных сценариях. Для человека запомнить все эти советы было бы довольно трудно и, возможно, непрактично.

4. Быть или не быть. Специалисты по обработке и анализу данных любят говорить о противоречиях, где работает метод X, но в некоторых случаях это может быть вредно. Это подпитывает представление о том, что ML — это парадокс, завернутый в тайну внутри загадки — иначе говоря, миссия невыполнима! AutoML идеально подходит для этого сценария благодаря разумному выбору настроек, которые в прошлом работали для этих алгоритмов.

В заключение я узнал, что в моем следующем проекте машинного обучения я позволю моему любимому набору инструментов AutoML сделать большую часть грязной работы, чтобы помочь мне сосредоточиться на бизнес-приоритетах. Оставайтесь с нами, чтобы узнать больше об этих наборах инструментов AutoML, чтобы сделать ваше путешествие по машинному обучению более плавным.

Экономьте время и деньги на машинном обучении

Вопросы по теме