Обзор машинного обучения

Что такое машинное обучение?

Машинное обучение — это концепция, которая позволяет машине учиться на примерах и опыте, и это тоже без явного программирования. Таким образом, вместо того, чтобы писать код, вы вводите данные в общий алгоритм, а алгоритм/машина строит логику на основе заданных данных.

Этапы машинного обучения:

Сбор данных. Этот этап включает сбор всех соответствующих данных из различных источников.

Обработка данных. Это процесс очистки и преобразования «необработанных данных» в формат, удобный для использования.

Анализ данных. Данные анализируются для выбора и фильтрации данных, необходимых для подготовки модели.

Алгоритм обучения. Алгоритм обучается на обучающем наборе данных, благодаря которому алгоритм понимает шаблон и правила, управляющие данными.

Тестовая модель. Набор тестовых данных определяет точность нашей модели.

Развертывание. Если скорость и точность модели приемлемы, то эту модель следует развернуть в реальной системе. После того, как модель развернута на основе ее производительности, модель обновляется и улучшается, если есть падение производительности, модель переобучается.

Типы алгоритмов машинного обучения.

  1. Алгоритм контролируемого машинного обучения:

Алгоритм контролируемого машинного обучения, обучающийся на основе обучающего набора данных, можно рассматривать как учитель, обучающий своих учеников. Алгоритм непрерывно прогнозирует результат на основе обучающих данных и постоянно корректируется учителем. Обучение продолжается до тех пор, пока алгоритм не достигнет приемлемого уровня производительности.

Позвольте мне перефразировать это простым языком:

В алгоритме контролируемого машинного обучения каждый экземпляр обучающего набора данных состоит из входных атрибутов и ожидаемых результатов. Набор обучающих данных может принимать любые данные в качестве входных данных, например значения строки базы данных, пиксели изображения или даже гистограмму звуковой частоты.

Пример.В Биометрической посещаемости вы можете обучить машину вводу вашей биометрической идентификации — это может быть ваш большой палец, радужка или мочка уха и т. д. После того, как машина будет обучена он может подтвердить ваш будущий ввод и может легко идентифицировать вас.

2. Алгоритм машинного обучения без присмотра:

Иногда данные неструктурированы и немаркированы. Поэтому становится трудно классифицировать эти данные по разным категориям. Неконтролируемое обучение помогает решить эту проблему. Это обучение используется для кластеризации входных данных в классы на основе их статистических свойств.

Позвольте мне перефразировать это простыми словами:

В подходе к обучению без учителя образец обучающего набора данных не имеет связанного с ним ожидаемого результата. Используя алгоритмы обучения без учителя, вы можете обнаруживать закономерности на основе типичных характеристик входных данных. Кластеризацию можно рассматривать как пример задачи машинного обучения, в которой используется подход к обучению без учителя. Затем машина группирует похожие образцы данных и идентифицирует различные кластеры в данных.

Пример: обнаружение мошенничества — это, пожалуй, самый популярный вариант использования неконтролируемого обучения. Используя прошлые исторические данные о мошеннических заявках, можно выделить новые претензии на основе их близости к кластерам, указывающим на мошеннические схемы.

3. Машинное обучение с подкреплением:

Все дело в том, чтобы предпринять соответствующие действия, чтобы максимизировать вознаграждение в конкретной ситуации.
когда дело доходит до обучения с подкреплением, ожидаемого результата нет. Агент подкрепления решает, какие действия предпринять для выполнения данной задачи. В отсутствие обучающего набора данных он обязан учиться на своем опыте.

Теперь давайте рассмотрим несколько реальных проектов машинного обучения, которые могут помочь компаниям получать прибыль.

Исследование — это когда обучающийся агент действует методом проб и ошибок, а Использование — когда он выполняет действие на основе знаний, полученных из среды. Среда вознаграждает агента за каждое правильное действие, что является сигналом подкрепления. Чтобы получить больше вознаграждения, агент улучшает свои знания об окружающей среде, чтобы выбрать или выполнить следующее действие.