Сначала задайте эти вопросы

Как организациям лучше всего расставить приоритеты в своих проектах машинного обучения? Что отличает хороший проект от плохого? Поскольку машинное обучение является новым для многих организаций, эти вопросы актуальны даже для опытных руководителей.

В этом посте будут изложены ключевые предварительные вопросы, которые помогут вам решить, как двигаться дальше. В будущих постах я рассмотрю вопросы о проектах и ​​процессах. Но, конечно, предварительные условия стоят на первом месте. Хотя вам не обязательно иметь конкретное представление о всем проекте, вы должны, по крайней мере, быть в состоянии ответить «да» на приведенные ниже вопросы.

Будьте честны с собой и со своей командой — неспособность ответить на эти четыре вопроса — хороший признак того, что, как бы вы ни интересовались машинным обучением как концепцией, вы не готовы заниматься машинным обучением на практике.

Если это так, не расстраивайтесь. Это может потребовать тяжелой работы, но как только вы сможете ответить на все эти вопросы, вы создадите прочную основу для машинного обучения, которое поможет вам добиться успеха. Нельзя торопиться с этими вопросами, чтобы «дойти до реального машинного обучения». Без этих компонентов вы в конечном итоге застрянете.

У вас есть идеи проекта?

Некоторые руководители интересуются машинным обучением, но не знают, с чего начать. Вам не нужны готовые идеи, чтобы начать, но у вас должен быть хотя бы эквивалент теста.

Часто лучше всего начать с ваших данных. Спросите себя, как вы используете свои данные сегодня. Можете ли вы автоматизировать любой из этих процессов? Хотели бы вы найти новые идеи в данных, на раскрытие которых у ваших сотрудников не хватает времени или возможностей?

Машинное обучение имеет так много разных приложений в разных отраслях и типах данных. Имейте в виду, что для того, чтобы быть эффективными, ваши идеи машинного обучения не обязательно должны быть оригинальными или казаться особенно креативными. Ничего страшного, если десятки или даже сотни других компаний использовали данные для автоматизации процесса и экономии денег. Это означает, что вы тоже можете это сделать.

Вам не нужна полная ясность, чтобы двигаться вперед — цель здесь просто в том, чтобы вывести вас на стартовую линию процесса оценки. По крайней мере, вам нужно понимать, что вы хотите сделать. Вам также необходимо представление о ваших данных, что приводит к следующему вопросу:

Есть ли у вас доступ к данным?

Даже если у вас есть идеи для проектов машинного обучения, они никуда не денутся без подкрепляющих их данных. Ничего страшного, если вам не хватает ясности в отношении точных данных, которые вам нужны. В этот момент даже веры в то, что вы можете получить это откуда-то, достаточно, чтобы начать более глубокую оценку. Если у вас нет внутренних данных, вы можете получить их из внешних источников.

Данные и идеи проекта идут рука об руку при выборе проектов машинного обучения. Если у вас нет ни данных, ни идей, ваша организация, вероятно, на данный момент не готова к машинному обучению.

Есть ли у вас ресурсы по науке о данных?

Есть ли у вас доступ к людям, внутренним или внешним, которые технически способны выполнить проект машинного обучения? Вам, вероятно, понадобятся не только специалисты по данным, но и инженерный талант, чтобы осуществить это. Вы также можете уточнить у своей технической группы, что они могут получить доступ к инструментам/оборудованию, необходимым им для выполнения работы (зная, что на данном этапе форма этой работы может быть нечеткой).

Вам действительно нужно машинное обучение?

Есть много проблем, которые могут показаться требующими машинного обучения, но на самом деле их можно решить с помощью таких простых статистических методов, как линейная регрессия. Не переусердствуйте с решением машинного обучения для более простой задачи.

Конечно, более простые идеи все еще могут быть очень полезными. Возможно, вы даже захотите сначала выполнить эти проекты, прежде чем переходить к машинному обучению, именно потому, что они проще и могут служить полигоном для проверки готовности базовых данных.

Если вы можете ответить «да» на все эти вопросы, вы готовы приступить к оценке вашего конкретного проекта. Я раскрою эти вопросы в своем следующем посте.

Джеймс Котецки (James Kotecki) – директор по маркетингу и коммуникациям в Infinia ML — команде специалистов по данным, инженеров и бизнес-экспертов, внедряющих машинное обучение в работу.