автор Том Хелвик

С ростом числа приложений машинного обучения компании начинают задаваться вопросом, как они могут использовать эти алгоритмы для себя. Действительно, машинное обучение стало чем-то вроде модного слова, горячей новой технологической тенденцией. Каждый хочет кусочек.

К сожалению, желание использовать машинное обучение и фактическое развертывание эффективного решения очень далеки друг от друга. Фактически, VentureBeat обнаружил, что 87% проектов, основанных на науке о данных, никогда не доходят до производства. Без правильной подготовки компании, которые пытаются использовать машинное обучение слишком быстро, рискуют совершить дорогостоящие ошибки и проекты, которые никуда не денутся.

Итак, как избежать неудач и настроить свои проекты данных на успех? В этом посте мы собрали наши основные идеи, чтобы направить вас на правильный путь.

Закладываем основу для машинного обучения

Большинство компаний, использующих машинное обучение в производстве, сегодня располагают огромными объемами данных, большими командами разработчиков и штатными экспертами, которые следят за тем, чтобы все шло как надо. Кроме того, они готовы тратить на эти проекты большие бюджеты и мириться с некоторыми неудачами на пути к успеху.

Однако для большинства компаний это не так. Для этих небольших или менее опытных компаний ключевое значение имеет постепенный переход к подходу, ориентированному на данные.

Вот основные шаги на пути к эффективному использованию данных и, в конечном итоге, к машинному обучению.

Четкие, достижимые результаты

Первая задача — определить ожидаемый результат от вашего проекта. На первых порах это должен быть простой минимально жизнеспособный продукт с узкой сферой применения. Не начинайте сразу заниматься машинным обучением. Вместо этого подумайте о вопросах, на которые было бы относительно легко ответить, проанализировав уже имеющиеся у вас данные.

Этот момент является ключевым, поскольку многие компании ставят перед собой грандиозные амбиции, которые нереалистичны. Зачастую проблема не вписывается в существующие модели машинного обучения или у компании недостаточно данных для эффективного обучения. По мере того как команда изо всех сил пытается создать рабочий продукт, который мог бы соответствовать ожиданиям некоторых руководителей, моральный дух падает, а бюджеты стремительно растут.

Вместо этого начните с малого. Найдите вопрос, на который легко ответить. Позвольте вашей команде исследовать данные, которые у вас есть в настоящее время, и предоставлять информацию по мере их поступления.

Выделять ресурсы

Еще одна проблема заключается в том, что компании часто недооценивают ресурсы, необходимые для запуска машинного обучения в производство.

Несмотря на то, что элементарную модель машинного обучения с открытым исходным кодом довольно легко заставить работать, очень сложно и долго настраивать эту модель для повышения точности. Кроме того, перенос этой модели в рабочую среду сопряжен со многими проблемами, связанными с развертыванием, созданием конвейеров данных и постоянными улучшениями.

Кроме того, эти проекты могут занять некоторое время, чтобы принести плоды. Будьте готовы тратить деньги на оплату труда разработчиков и вычислительные ресурсы в течение многих месяцев, прежде чем проект даст первые полезные результаты.

Нанимайте правильных людей

Когда дело доходит до создания конвейеров данных, выбора моделей, их обучения на больших наборах данных и объединения всего этого в производственной среде, опыт имеет значение.

В связи с растущим спросом рассчитывайте заплатить большие деньги, чтобы получить в команду опытных сотрудников, которые смогут приступить к созданию ваших систем. Важно отметить, что ваш первый сотрудник, вероятно, не должен быть специалистом по данным, который может выбирать модели машинного обучения и рассчитывать статистику более высокого уровня. Вместо этого сосредоточьте своих первых сотрудников на создании инфраструктуры и организации данных. Эти сотрудники, известные как инженеры данных, обычно имеют опыт разработки программного обеспечения и могут помочь вам создать чистое, организованное хранилище данных.

В Intertech мы предвзяты, но еще один отличный способ быстро передать опыт вашей команде — нанять консультанта по обработке данных и машинному обучению, чтобы быстро ввести вас в курс дела.

Первые шаги машинного обучения

Если вы загрузите работу заранее, вы настроите свой проект машинного обучения на успех. Принимая во внимание основу, инфраструктуру и требования ваших проектов данных, вы уже опережаете конкурентов, которые берутся за дело без тщательного планирования. Теперь вы можете воспользоваться ранними победами, открытыми для компаний, которые организовали свои данные и легко доступны.

Об Интертех

Компания Intertech, основанная в 1991 году, предоставляет консультации по разработке программного обеспечения и обучение в области ИТ для компаний, входящих в список Fortune 500, государственных и ведущих технологических учреждений. Узнай больше о нас. Независимо от того, являетесь ли вы разработчиком, заинтересованным в работе в компании, которая инвестирует в своих сотрудников, или компанией, желающей стать партнером команды технологических лидеров, которые предоставляют решения, наставляют сотрудников и повышают реальную ценность для бизнеса, мы хотели бы встретиться с вами.

Первоначально опубликовано на https://www.intertech.com 7 января 2020 г.