Машинное обучение (МО) — это захватывающая область в области искусственного интеллекта (ИИ), которая фокусируется на создании интеллектуальных программ с использованием данных. Согласно рыночным исследованиям, ожидается рост на 20%+ в год. Более того, многие компании, учреждения и стартапы обращаются к машинному обучению для решения одних из самых сложных задач (таких как свертывание белков, генерация изображений/видео и самоуправляемые автомобили).

В рамках дисциплины ML существует три различных типа ML: обучение с учителем, обучение без учителя и обучение с подкреплением. В этой статье мы обсудим, что представляют собой эти разные типы машинного обучения и их различия.

Обзор машинного обучения

Прежде чем углубляться в типы ML, мы определим, как работает ML в целом, а затем объясним, почему существуют разные типы. Машинное обучение — это процесс использования данных для принятия правил и решений. Общий обзор процесса машинного обучения заключается в поиске данных, их использовании в алгоритмах/моделях, которые используют данные для информирования о своих выводах (часто называемых обучением), и развертывании их на новых данных (часто называемых выводами).

В основе любой системы машинного обучения лежат данные — они информируют об этапах процесса, используемых нами моделях и качестве указанных моделей. Данные могут поступать во многих формах, что в конечном итоге влияет на то, как мы проводим процесс машинного обучения. В зависимости от данных этапы обучения и вывода могут значительно различаться. Таким образом, различные типы машинного обучения возникают из-за различных типов данных, с которыми мы можем столкнуться, и различного набора методов/алгоритмов, которые мы используем, чтобы сделать данные полезными.

Контролируемое обучение

Обучение с учителем относится к машинному обучению в контексте помеченных данных. В рамках этого типа машинного обучения наши данные имеют как функции (т. е. переменные, интересующие величины, измерения и т. д.), так и метки (т. е. то, что мы хотим, чтобы наша модель определяла/предсказывала). Например, мы можем захотеть создать классификатор машинного обучения, который определяет наличие у пациента рака по рентгеновскому снимку. В контролируемом контексте наш набор данных будет иметь рентгеновские снимки пациента (это особенности) и диагноз (это метка — мы хотим, чтобы модель определяла это на основе рентгеновского снимка). Другим примером является определение цен на дома на основе атрибутов собственности. В контролируемом контексте наш набор данных будет содержать сведения о доме, такие как количество комнат, квадратный метр, наличие мебели или нет и т. д. (это характеристики) и цена дома (это метка).

При обучении с учителем модель/алгоритм машинного обучения будет принимать функции и выводить то, какой должна быть метка. Поскольку у нас есть метки, мы можем наблюдать за моделью и определять, была ли она правильной или нет. Затем мы можем передать эту информацию обратно в модель, чтобы она могла выполнить итерацию и улучшить свою производительность. Кроме того, мы можем постоянно оценивать модель машинного обучения, поскольку у нас есть правильные ответы для сравнения с выходными данными модели. Таким образом, методы в рамках этого типа ML обычно сосредоточены на оптимизации некоторой метрики близости между выходными данными ML и истинным ответом / точкой данных.

Некоторые популярные модели/алгоритмы, используемые в обучении с учителем, включают линейную регрессию, логистическую регрессию, KNN, деревья решений, случайные леса и нейронные сети.

Обучение без учителя

Неконтролируемое обучение — это машинное обучение без меток — у нас есть только функции. Ссылаясь на наши примеры из предыдущего раздела, в контексте без присмотра у нас были бы только данные рентгена без диагноза и только детали дома без цен. Как правило, задачи машинного обучения без учителя сложнее, поскольку нет прямого способа проверить правильность решений, принятых программой машинного обучения.

Часто типы методов неконтролируемого обучения вращаются вокруг сокращения данных и кластеризации. Целью неконтролируемого обучения является поиск шаблонов и групп в данных. Возвращаясь к рентгеновским данным, кластеризация набора данных может выявить группы пациентов, каждая из которых представляет разные уровни тяжести. Что касается данных о жилье, группировка свойств может помочь определить, есть ли дома, которые являются выбросами (т. Е. Не попадают ни в один кластер) — эти дома потенциально могут быть отличными инвестициями.

Некоторыми популярными методами обучения без учителя являются K-Means, PCA и иерархическая кластеризация.

Обучение с подкреплением (RL)

Обучение с подкреплением относится к машинному обучению, при котором программа учится, собирая данные посредством взаимодействия/принятия последовательных решений со своей средой. В контексте RL программа, которую часто называют агентом, будет взаимодействовать со своей средой и собирать наблюдения/точки данных. Затем он будет использовать эти точки данных для принятия решения и получит некоторое вознаграждение (положительное или отрицательное). Цель агента — максимизировать сумму вознаграждения, поэтому он постоянно обновляет свои решения на основе прошлых решений для соответствующей оптимизации.

Обучение с подкреплением является распространенным выбором для задач, где данные представляют собой последовательные решения, принимаемые программой. Например, для беспилотного автомобиля точки данных для оценки того, хорошо ли работает автомобиль, исходят от самого автомобиля. Каждое решение, которое принимает автомобиль, является точкой данных, которую можно использовать для определения его производительности. Другой пример — робототехника, где данные о решениях робота заранее информируют его о следующем наборе решений.

Часто в настройке RL используются симуляции для сбора данных о решениях и обучения программы. Программа выполнит набор решений в симуляции, а затем получит обратную связь в виде функции вознаграждения (которую практикующий разрабатывает для вознаграждения за желаемое поведение и наказания за отклонения). Затем, когда он снова пройдет симуляцию, он будет использовать свои прошлые симуляции и вознаграждение, чтобы информировать о своем новом наборе решений. Это будет продолжаться, каждый раз опираясь на весь предыдущий набор решений, пока он не сможет работать хорошо. После чего он будет протестирован на реальном устройстве или физически в реальном мире.

Некоторыми популярными методами в RL являются State Action Reward State Action (SARSA), Q-learning и Deep Q Networks.

Другие типы машинного обучения

Сфера ML стремительно развивается, поэтому таксономия ML постоянно развивается/расширяется. Хотя три типа, которые мы обсуждали, широко используются в мире машинного обучения, появляются и другие типы со своим собственным набором областей применения, требованиями к данным и методами моделирования. В этом разделе будут рассмотрены некоторые другие типы машинного обучения (примечание: он не будет исчерпывающим).

  • Обучение под наблюдением: этот тип машинного обучения объединяет наборы данных без меток с наборами данных с метками. С немаркированными наборами данных сложно работать, а количество методов ограничено. Мы можем преобразовать немаркированный набор данных в набор данных с метками и войти в мир контролируемого обучения, если мы пометим наши данные. Однако это может быть дорогостоящим и трудоемким, что делает его неосуществимым. Именно здесь вступает в действие полууправляемое машинное обучение — оно пытается объединить некоторые помеченные точки данных, чтобы улучшить результаты при работе с неразмеченными данными. Часто полууправляемое обучение возникает, когда у нас есть набор данных с частичными метками или мы тратим некоторые ресурсы, чтобы пометить какую-то разумную/выполнимую часть неразмеченного набора данных.
  • Мультимодальное обучение: относится к машинному обучению, когда данные содержат разные модальности. Например, набор данных содержит текст, аудио, изображения, данные датчиков и демографические характеристики, которые представляют собой различные модальности информации. Информация и данные из изображения сильно отличаются от текста или сенсора — изображение двумерное, фиксирует информацию в пространстве и обычно состоит из нескольких тысяч чисел/пикселей информации, тогда как текст/сенсоры намного меньше по размеру и имеют последовательный/временной заказ. В настоящее время мы установили методы работы с каждой модальностью по отдельности, но объединение модальностей создает новые проблемы и соображения модели, поэтому это считается отдельным типом ML. С точки зрения того, где он соответствует контролируемому, неконтролируемому домену и домену RL, он охватывает все три. С мультимодальным набором данных вы можете пометить набор данных, не пометить его или сгенерировать путем последовательного принятия решений.
  • Федеративное обучение: относится к машинному обучению, при котором модель может обучаться на устройстве без необходимости отдельного хранения самих данных. Традиционно в ML данные хранятся в базе данных, из которой извлекается модель. Для мобильных данных или данных устройств потребуется передача данных на устройстве в базу данных через облако. Как только данные находятся в базе данных, модель ML может (повторно) обучаться на них. В контексте федеративного обучения вместо хранения данных устройства в отдельной базе данных данные остаются на устройстве. Модель будет отправлена ​​через облако на устройство, откуда она получит доступ к данным на устройстве и будет обучаться на устройстве. После обучения модель отправляется обратно через облако для использования в другом месте. Благодаря федеративному обучению данные пользователя остаются у пользователя и никогда не покидают устройство, что обеспечивает большую конфиденциальность и безопасность данных пользователя. Некоторыми из проблем федеративного обучения являются ограниченные вычисления на устройстве (т. е. устройство не имеет достаточных вычислительных возможностей для обучения модели) и объединение обучения модели на разных устройствах (т. е. объединение обучения с разных устройств в одну унифицированную модель). Подобно мультимодальному, федеративное обучение может охватывать области контролируемого, неконтролируемого обучения и обучения с подкреплением.

Заключение

Машинное обучение (ML) — это область использования данных для информирования интеллектуальных систем. В этой статье мы рассмотрим три различных типа машинного обучения: обучение с учителем, когда данные помечены, обучение без учителя, когда данные не помечены, и обучение с подкреплением, когда данные представляют собой последовательные решения.

Чтобы узнать больше по теме, ознакомьтесь с: Различия между искусственным интеллектом, машинным обучением и глубоким обучением.