Прекратите экспериментировать с машинным обучением и начните его использовать!

Оказывается, в подходе большинства компаний к машинному обучению, аналитическому инструменту будущего, есть фатальный изъян: 87% проектов не проходят стадию эксперимента и поэтому никогда не попадают в производство.

Почему так много компаний, предположительно на основе рациональных решений, ограничивают себя просто изучением потенциала машинного обучения и даже после крупных инвестиций, найма специалистов по данным и инвестирования ресурсов, времени и денег не могут перейти к следующему уровень?

Проще говоря, врожденное экспериментальное мышление. В течение многих лет мы решили, что машинное обучение, которое на самом деле представляет собой дисциплину, возникшую много десятилетий назад и просто остановившуюся на некоторое время, пока не догонят технологии, требует групп специалистов по данным, вооруженных такими языками программирования, как Python, R, которые будут разрабатывать специальные инструменты для проведения комплексного анализа, необходимого для разработки и обучения этих мифических алгоритмов. Все это рассматривалось как эксперимент. Даже сегодня неважно, с кем вы консультируетесь, будь то чрезвычайно популярный курс Эндрю Нг, Машинное обучение для обычных людей или даже Абсолютное начало машинного обучения, вы » Вам скажут, что вам нужно научиться программировать, а затем заново изучать статистику, как если бы мы начинали с нуля, хотя на самом деле инструменты существуют уже много лет.

Может ли кто-нибудь подумать о найме инженеров-программистов для разработки инструмента для ведения счетов компании? Конечно, нет. Вместо этого предприятия выбирают бухгалтерскую программу и используют ее. Единственное различие между бухгалтерским учетом и машинным обучением - это исходный материал, который они используют: в целом бухгалтерские данные, которые мы вводим в наши учетные записи, легко доступны, рассчитываются достаточно стандартизованным образом и не вызывают сомнений в их происхождении. И все же данные, которые мы вводим для анализа машинного обучения, зачастую труднее найти или подготовить. Что действительно происходит, так это то, что у нас есть проблема с культурой данных, и поэтому нам нужно внушать нашим сотрудникам важность данных, переосмысление нашей цепочки создания стоимости для получения данных, которые мы ранее игнорировали. Если у нас есть данные, их анализ с помощью машинного обучения должен сводиться к использованию правильных инструментов для работы. Если вместо того, чтобы просто использовать эти инструменты, мы вместо этого потратим время на их изобретение, наши проекты никогда.
не сдвинутся с мертвой точки.

Если вам посоветовали запустить проект машинного обучения в вашей компании, вам потребуется нанять одного или нескольких специалистов по данным и написать миллионы программ на Python или R, остановитесь и переосмыслите все это с людьми, которые действительно знают, что они говорят, иначе вы в конечном итоге попытаетесь изобрести велосипед и потерпите неудачу, потому что у вас не будет правильных инструментов для работы. Вероятность того, что такие эксперименты действительно будут запущены в производство, а это единственный действительный показатель для их оценки, столь же редка, как упомянутые выше 13%. Другими словами, вы с 87% вероятностью потратите впустую свое время, силы и деньги. Это проигрышная игра.

Машинное обучение давно прошло экспериментальную фазу, и теперь MLaaS - машинное обучение как услуга - уже входит в массовую фазу. Пожалуйста, имейте это в виду. Если те, кто хочет начать проект машинного обучения в вашей компании, проигнорируют это и попытаются вернуться к экспериментальной фазе, проигнорируйте их или, что еще лучше, спросите их, считают ли они, что вам нужно привлекать инженеров для разработки электронной таблицы. Дело в том, что где-то один из ваших конкурентов уже использует стандартные инструменты для выполнения этих задач, и они действуют намного быстрее, чем ваша компания.

Не дайте себя обмануть: применить машинное обучение непросто: мы говорим о сложных аналитических процедурах, в которых этапы определения целей, а также сбор и преобразование данных будут занимать очень высокий процент усилий по проекту. К этим проектам нельзя относиться легкомысленно. Но они не являются слишком сложными и не требуют экспертов для создания экспериментальных аналитических инструментов, потому что эти аналитические инструменты существуют уже давно.

Если мы откажемся от абсурдного экспериментального подхода к машинному обучению, которое является побочным продуктом невежества и страха, мы добьемся гораздо большего прогресса.

Эта статья ранее была опубликована в Forbes.

(En español, вода)