Что такое машинное обучение?

Машинное обучение — это отрасль искусственного интеллекта и компьютерных наук, которая использует алгоритмы и данные для обучения и прогнозирования. Это дает компьютерам возможность учиться и принимать решения, как люди, без явного программирования. В современном мире он используется практически во всех областях. Некоторые из самых популярных приложений машинного обучения включают виртуальных помощников, беспилотные автомобили, рекомендации в социальных сетях, рекомендации по продуктам, фильтрацию электронной почты и т. д.

Машинное обучение бывает разных типов в зависимости от типа данных, которые оно использует для обучения, и типа прогнозов, которые должны быть сделаны на основе этих данных. В этой статье мы узнаем о четырех различных типах алгоритмов машинного обучения и их реальных приложениях.

Различают следующие типы алгоритмов машинного обучения:

  1. Контролируемое обучение
  2. Неконтролируемое обучение
  3. Полуконтролируемое обучение
  4. Обучение с подкреплением

Давайте проверим следующий раздел, чтобы узнать больше о них и их применении в реальном мире.

1. Контролируемое обучение:

Это тип машинного обучения, который использует структурированные и помеченные наборы данных для обучения моделей и точного прогнозирования результатов. В этом типе пользователь уже знает тип результата, который требуется от данных. Он содержит независимые переменные, которые используются для обучения модели, а зависимая переменная — это результат, который должен быть предсказан на основе данных. Модель машинного обучения учится на независимых переменных и на их основе делает прогноз на будущее.

Обучение под наблюдением подразделяется на следующие две категории:

  • Регрессия. Используется, когда выходные данные представляют собой непрерывное или действительное значение, например, цена автомобиля или вес человека и т. д.
  • Классификация. Классификация используется, когда зависимая переменная представляет собой дискретное значение, такое как «спам» или «не спам», «мужской» или «женский» и т. д.

Различные контролируемые алгоритмы: линейная регрессия, логистическая регрессия, K-ближайшие соседи, деревья решений и SVM (машины опорных векторов) и т. д.

Реальные приложения контролируемого обучения следующие:

  • Прогноз цен
  • Фильтрация спама
  • Распознавание лиц
  • Распознавание речи
  • Классификация изображений
  • языковой перевод и т. д.

2. Неконтролируемое обучение:

Это тип машинного обучения, в котором используются неструктурированные и немаркированные наборы данных. Он используется для обнаружения скрытых закономерностей в данных без участия человека. При этом зависимая или целевая переменная неизвестна, что означает, что результат данных неизвестен на начальном этапе. Машина сама обнаруживает закономерности и выдает соответствующие результаты.

Неконтролируемое обучение имеет три общих подхода, которые заключаются в следующем:

  • Кластеризация. Это метод, который группирует или формирует кластеры неразмеченных данных в соответствии со сходством или различием свойств данных.
  • Правила ассоциации. Это метод, основанный на правилах, который находит связи между различными переменными в наборе данных. Он обычно используется при анализе потребительской корзины.
  • Уменьшение размерности. Это метод, который используется для уменьшения количества измерений или объектов в наборе данных, чтобы это не приводило к переоснащению.

Различные алгоритмы неконтролируемого обучения: кластеризация K-средних, K-ближайших соседей, иерархическая кластеризация, анализ основных компонентов и обнаружение аномалий и т. Д.

Реальные приложения обучения без учителя следующие:

  • Рекомендательные системы
  • Сегментация продукта
  • Разделы новостей
  • Компьютерное зрение
  • Сегментация клиентов и др.

3. Полуконтролируемое обучение:

Это метод машинного обучения, который находится между контролируемым и неконтролируемым обучением. Он использует как помеченные, так и немаркированные данные для обучения алгоритма. Он содержит небольшое количество размеченных данных и большое количество неразмеченных данных. При этом неконтролируемое обучение используется для создания кластеров данных, а затем помеченные данные используются для итеративной маркировки этих немаркированных данных. Это экономит время и деньги, поскольку немаркированные данные можно пометить, используя помеченные данные.

Различают следующие методы полуконтролируемого обучения:

  • Генеративные модели
  • Разделение с низкой плотностью
  • Регуляризация Лапласа
  • Эвристические подходы

Реальные приложения обучения с полуучителем следующие:

  • Обнаружение речи
  • Определение трехмерной структуры белка
  • Определение наличия масла в определенном месте
  • Классификация веб-контента и т. д.

4. Обучение с подкреплением:

Это метод машинного обучения, основанный на вознаграждении. В этом алгоритме агент подкрепления учится на опыте, на основании которого он принимает последовательность решений. Основная цель агента — действовать, принимая решения, обеспечивающие максимальное вознаграждение в конкретной ситуации. Не существует зависимой переменной или предопределенного решения проблемы, машина сама находит решение, используя метод проб и ошибок.

Различают следующие типы обучения с подкреплением:

  • Позитивное обучение с подкреплением
  • Обучение с отрицательным подкреплением

Существуют различные алгоритмы обучения с подкреплением, такие как Q-Learning, Deep Q Network, SARSA и DDPG и т. д.

Реальные приложения обучения с подкреплением следующие:

  • Обработка изображений
  • Игры
  • Робототехника
  • Навигационная система и т.д.

Вывод:

В этой статье мы узнали о четырех типах алгоритмов машинного обучения: контролируемом, неконтролируемом, полуконтролируемом и обучении с подкреплением с их реальными приложениями. Я также хотел бы подробно объяснить каждый из них отдельно в следующих статьях.

Чтобы узнать больше о будущем контенте, связанном с Python, машинным обучением, наукой о данных и интерфейсной разработкой, подпишитесь на Chirag Rathi!

Приятного обучения!😊

Связаться со мной🤙: