Алгоритмические модели: как это может помочь или разрушить ваш первый проект машинного обучения

Если и есть что-то, что может улучшить или разрушить ваш проект машинного обучения, так это тип модели алгоритма, которую вы используете.

Ладно, я только что потерял тебя там? Сделаем несколько шагов назад.

Как работает машинное обучение?

Типичный проект машинного обучения следует четырехэтапному процессу. Первым шагом является сбор данных путем интеграции с различными базами данных, приема документов или вызова нескольких интерфейсов прикладного программирования с облачной платформы. Алгоритмическая модель в конечном итоге обрабатывает данные для извлечения информации из структурированной и неструктурированной информации.

Модель алгоритма относится к тому, как набор правил интерпретирует наборы данных. Например, алгоритмическая модель под названием регрессия может определить, какой средний доход покупателя необходим для покупки определенного продукта, основываясь исключительно на вероятности. Когда модель создана, ее легко встроить в приложение бизнес-аналитики, веб-сайт или любой аналитический инструмент, как правило, через подключение к веб-службе.

Отсюда процесс машинного обучения быстро переходит в обучение. Если вы помните фильм Чаппи, главного героя-робота захлестнул поток информации в тот момент, когда он пришел в сознание. Сначала он вел себя растерянно и агрессивно; но его создатель немедленно научил его обрабатывать то, что он чувствует. Благодаря этому Чаппи приспособился и быстро погрузился в человеческую жизнь, полную ее взлетов и падений. К сожалению, он прошел этот процесс обучения с головорезами, что сделало его ключевым оружием в ограблениях банков. Несмотря на это, Чаппи быстро научился и, в конце концов, стал обрабатывать вещи независимо от своих родителей и лишь на короткое время, будучи в состоянии превзойти знания и опыт своего создателя. Точно так же, как Чаппи был обучен обрабатывать и интерпретировать информацию, таким будет любой проект искусственного интеллекта или роботизированной автоматизации процессов.

Что делает или ломает ваш проект машинного обучения

Когда вы начинаете свой первый проект по машинному обучению и искусственному интеллекту, очень важно, чтобы наша алгоритмическая модель была правильной. Помните, что вам не нужно выбирать одну структуру, вы можете построить гибридную модель, состоящую из различных интеллектуальных моделей автоматизации и логических моделей, чтобы получить нужный результат. В зависимости от характера вашего вопроса вы должны выбрать подходящую модель обучения.

Например, если вы хотите спрогнозировать будущее поведение клиентов, вам подойдут регрессионные модели. С другой стороны, идентификация и прогнозирование редких и необычных точек данных обычно выполняются с помощью моделей обнаружения аномалий. Как вы, возможно, уже поняли, существует множество моделей алгоритмов. Однако существует три основных стиля обучения: контролируемое, неконтролируемое и с подкреплением.

Контролируемое обучение

Алгоритм обучения с учителем — самая простая из всех моделей, самая простая для понимания и обучения. Он работает, создавая функцию, обученную путем подготовки набора данных для следования желаемому состоянию или результату. После обучения модель будет применена к новому набору данных для проверки ее прогностической эффективности. Отличным примером этого является дерево решений, в котором алгоритмы делают выводы на основе множества решений да или нет.

Неконтролируемое обучение

С другой стороны, модели алгоритмов неконтролируемого обучения не полагаются на обучение набора данных, вместо этого они группируются в классы на основе их характеристик. Прекрасным примером этого является кластеризация k-средних, в которой определение принадлежности к кластеру данных выполняется путем знания того, насколько далеко или близко оно находится от центроида кластера. Центроид является средним значением всех элементов данных. Если данные находятся рядом с ним, это означает, что он действительно должен быть членом этого класса. С другой стороны, вход, который находится далеко от центроида, будет перенесен в другой кластер или будет создан новый.

Интеллектуальные продукты автоматизации, такие как Интеллектуальная автоматизация процессов WorkFusion (SPA), позволяют обрабатывать неструктурированные данные, такие как PDF-файлы, документы и изображения, с использованием моделей обучения без учителя. WorkFusion’s SPA сочетает в себе лучшее из роботизированной автоматизации процессов (RPA) и когнитивного ИИ для автоматизации времени обучения алгоритма. Он работает, используя исторические данные и информацию в реальном времени для регулярного обучения моделей алгоритмов. Благодаря этому подходу не только легко извлекать и сопоставлять данные из неструктурированных документов, но и использовать большие данные для получения ценных бизнес-идей.

Обучение с подкреплением

Третья классификация алгоритмов известна как обучение с подкреплением. Здесь алгоритм работает, исследуя пары состояние-действие и вознаграждает лучшие пары в зависимости от их способности достичь цели. Эта модель алгоритма обучается независимо за счет кумулятивного вознаграждения или наказания за свои действия.

Отличным примером этого является игровая программа Google под названием AlphaGo Zero. В отличие от своего предшественника, который изучал выигрышные ходы, изучая тысячи людей-любителей и профессиональных игроков, AlphaGo Zero учится выигрывать и играть без помощи человеческих данных. Играя в игру против самого себя, он оценивал сотни позиций и пробных ходов, не полагаясь на методы лучших профессионалов, таким образом, самостоятельно совершенствуя свой алгоритм.

Разрабатываем гибридную модель машинного обучения

Успех любого ИИ, машинного обучения или RPA зависит от выбора подходящих моделей обучения, которые могут быть реализованы как гибрид, чтобы отвечать на вопросы и эффективно удовлетворять потребности бизнеса. Например, гибридные модели, такие как суммирование, сочетают в себе неконтролируемые и регрессионные модели для повышения эффективности прогнозирования. Эти метаалгоритмы, также известные как ансамблевые методы, используют различные методы, такие как бэггинг для уменьшения дисперсии, повышение для уменьшения систематической ошибки и стейкинг для улучшения прогнозов. Существует несколько платформ, упрощающих использование модели гибридного машинного обучения, например WorkFusion. Например, WorkFusion SPA объединяет алгоритмы с открытым исходным кодом, такие как Марков и Глубокое обучение нейронных сетей, с их проприетарными моделями. Это позволяет решению оптимизировать процесс машинного обучения и постоянно улучшать его структуру даже без помощи человека.

Помните, что модель алгоритма может решить ваш проект машинного обучения или разрушить его. Хотя удобно выбрать одну модель из трех основных структур обучения, реальность такова, что ИИ, чтобы быть действительно актуальным, должен рассуждать, как человек. При этом использование гибридных моделей для достижения автономного обучения является идеальным. Гибридный ИИ может создать надежную платформу, которая может использовать тысячи, даже миллионы неструктурированных и разрозненных источников данных, которые на самом деле являются неиспользованным богатством организационных знаний, которые могут помочь компании выиграть или проиграть рыночную гонку.

Первоначально опубликовано на www.techwebspace.com 24 марта 2018 г.