Генеральный директор Datanomers с видением демократизации машинного обучения

Как новичок в области машинного обучения (ML), вы обычно сталкиваетесь с несколькими вопросами: действительно ли мне нужно прилагать усилия, чтобы узнать об этой технологии? Если да, то как мне начать? Есть ли подводные камни? Повысят ли эти знания мои возможности трудоустройства? В этой статье мы постараемся ответить на некоторые из этих вопросов.

Для начала обязательно стоит узнать о машинном обучении. Это будущее — интеллектуальные машины будут предсказывать ваш мир, объяснять ценные идеи, автоматизировать некоторые задачи (например, вождение автомобиля) и помогать вам принимать оптимальные решения. Даже будучи профессионалом в области программного обеспечения, вам необходимо улучшать свои навыки, потому что ML будет разрабатывать экспертные системы, уменьшая потребность в традиционной разработке программного обеспечения.

Начало может показаться сложным. Стоит ли записываться на курс? Не обязательно. Большинство курсов предназначены для того, чтобы вы стали специалистом по данным, а это может быть не то, что вы хотите для своей карьеры. Вместо этого вы можете предпочесть использовать ML как случайный практик, а не эксперт.

Путь вперед — это прочитать о том, как ML может помочь в достижении ваших целей, собрать ограниченные обучающие данные (переменные, которые вы считаете важными) для обучения ML и зарегистрироваться на платформе ML, которая проведет вас через процесс создания моделей для предсказывать. Некоторые предпочитают, чтобы платформа машинного обучения была с открытым исходным кодом, но за это приходится платить: предполагаемый опыт программирования на таких языках, как Python, может помешать вам заняться машинным обучением.

Изучая платформу машинного обучения, убедитесь, что вы выбрали удобную платформу с простыми в использовании видеороликами для самопомощи и щедрой поддержкой, которая поможет вам преодолеть любые проблемы. Когда у вас будет первая модель машинного обучения, сравните ее прогнозы с тем, что вы на самом деле наблюдаете, прекрасно понимая, что машинное обучение — это итеративный процесс уточнения.

Приведенные выше рекомендации кажутся логичными, но давайте проиллюстрируем их конкретными случаями, которые вам могут быть интересны.

Скажем, вы являетесь экспертом в области операционного процесса на предприятии. Процесс получает доступ к данным из различных источников, включая облако, и решает, как его выполнять. Нелегко написать правила о том, как охватить различные возможности, включающие множество исключений. Расследовать каждый запрос утомляет вас. Вы часто задавались вопросом, можете ли вы построить систему, которая бы помогала вам — систему, подсказывающую, как обработать запрос и его причину. Вы слышали о машинном обучении и о том, как оно может помочь изобрести такую ​​систему, облегчающую вашу рабочую нагрузку. Но вы не знаете, с чего начать — как изобрести обучающие данные для обучения машинному обучению (для обучения с супервизором).

Вот еще один пример потенциальной дилеммы. Допустим, вы изучаете экономику и собрали массу данных о своем исследовательском проекте. Вы хотели бы получить представление о том, что данные говорят о результате, который вы анализируете. Что вы должны сделать? Изучить корреляцию между переменными? Но это может ввести в заблуждение. Вы слышали о машинном обучении и о том, как оно может помочь, но не знаете, с чего начать — как изучить машинное обучение, чтобы использовать его в своем проекте.

Я считаю, что эти проблемы сдерживали широкое внедрение машинного обучения. Итак, что вы должны искать в платформе машинного обучения, чтобы помочь вам преодолеть эти препятствия?

Давайте начнем с проблемы с обучающими данными, которая представляет собой серьезную проблему. Существует множество поставщиков обучающих данных, которые выросли как грибы (например, Lionbridge, Appen). Они предоставляют вам краудсорсинговые обучающие данные, прилагая все усилия, чтобы очистить их и освободить от предвзятости. Однако вполне может быть, что вы не можете разглашать детали своего процесса, поскольку они содержат строго конфиденциальную информацию, поэтому вы не можете воспользоваться этими услугами. Или вы изучаете ML и у вас нет утвержденного бюджета для оплаты этих услуг.

При изучении платформы машинного обучения ищите ту, у которой есть «соединители» для большинства распространенных источников данных, включая ваши системы и облако, для автоматического извлечения интересующих вас информационных элементов. Эти соединители должны иметь возможность автоматически захватывайте информационные элементы, собирайте их в файл в соответствующем порядке и приступайте к обучению статистических моделей на основе обучающих данных в вашем файле, чтобы вы могли предсказывать свой мир. Коннекторы должны быть сложными, чтобы периодически извлекать данные, один раз в день или время от времени, и собирать достаточное количество данных в течение нескольких дней и недель, чтобы вы могли получить данные для обучения, чтобы начать работу с ML.

Так как же использовать эти данные для понимания машинного обучения и построения моделей? Ищите платформу машинного обучения, которая автоматически создает модели на основе обучающих данных. В нем также должны объясняться различные этапы, чтобы вы могли понять и оценить, как платформа обрабатывает ваши данные, какие статистические методы она применяет и почему, а также как она выбирает лучшую модель для изучения и прогнозирования для вашего варианта использования. Если у вас нет этих ответов, это ставит вас в неудобное положение, когда вы не можете уверенно обсуждать свою работу с коллегами.

Вывод: изучайте машинное обучение, занимаясь машинным обучением. Машинное обучение развилось до такой степени, что вы больше не должны бояться, с чего начать.

Справочник

https://www.forbes.com/sites/forbetechcouncil/2020/08/07/how-to-get-started-with-machine-learning/#222a5a6137cb