1. Контролируемое машинное обучение:

Модели контролируемого обучения обучаются на наборах данных, содержащих помеченные данные. В этих моделях обучение происходит, когда используются многочисленные примеры для обучения алгоритма сопоставлению входных переменных с желаемыми выходными данными (также называемыми целевыми переменными или метками). На основе этих примеров модели машинного обучения способны выявлять закономерности, связывающие входы с выходами. Такие модели машинного обучения могут затем воспроизводить эти шаблоны, используя правила, отточенные во время обучения, для преобразования новых входных данных в классификации или прогнозы. Классическим примером обучения с учителем является использование различных переменных, таких как наличие таких слов, как лотерея или вы выиграли, чтобы предсказать, следует ли классифицировать электронное письмо как спам или нет. Обучение под наблюдением может принимать форму классификации, такой как предсказание того, является ли электронное письмо спамом или нет, или регрессии, которая включает определение взаимосвязи между входными переменными и целевой переменной. Хотя линейная регрессия и классификация являются простейшими формами обучения с учителем, другие модели с учителем, такие как машины опорных векторов и случайные леса, также являются распространенными приложениями.

2. Обучение без учителя

Цель обучения без учителя состоит в том, чтобы система выявляла закономерности среди данных, а обучение с учителем — это процесс сопоставления отношений между точками данных. Неконтролируемое обучение включает в себя выявление шаблонов, шаблонов обучения без учителя путем использования правил, отточенных во время обучения, для преобразования новых полученных входных данных в классификации или прогнозы. Распространенным применением неконтролируемого обучения является кластеризация, при которой модель получает немаркированные входные данные и определяет сходства и различия между точками входных данных, в результате чего создаются кластеры на основе сходств, которые являются важными факторами при категоризации входных данных. Пусть модели даны виды фруктов, животных, цветка и дерева. На основе признаков, уникальных для каждой из категорий, кластеризация позволяет разделить животных, фрукты и растения на три отдельные группы. Уменьшение размерности — еще одна форма обучения без учителя.

3. Обучение с подкреплением Модели обучения с подкреплением обучаются на основе своего опыта в виртуальной или реальной среде, а не на существующих данных. Агенты обучения с подкреплением ищут оптимальный способ выполнения задачи, предпринимая ряд шагов, которые максимизируют вероятность выполнения этой задачи. В зависимости от успеха или неудачи шагов, которые они предпринимают, они вознаграждаются или наказываются. Эти «агенты» запрограммированы так, чтобы выбирать свои шаги для максимизации своего вознаграждения. Они «учатся» на прошлых наградах и неудачах, совершенствуются с помощью многочисленных итераций проб и ошибок и могут быть разработаны для разработки долгосрочных стратегий, чтобы максимизировать свое вознаграждение в целом, а не смотреть только на свой следующий шаг. Типичный пример обучения с подкреплением можно найти в разработке автономных транспортных средств (самоуправляемых автомобилей). Обучение с подкреплением используется для улучшения характеристик автомобиля в смоделированной среде, проверяя такие вещи, как реакция на управление движением и ускорение. Посредством этих взаимодействий с моделируемой средой «агенты» обучения с подкреплением наказываются или вознаграждаются в зависимости от выполнения задачи, что влияет на будущую производительность транспортного средства.