Обучение под наблюдением: начало для новичков

написаноПаритошем Марате и Сандешем Локханде

В предыдущем посте мы рассмотрели основы машинного обучения. В этом мы начнем с первой парадигмы ML, а именно обучения с учителем.

Обучение под наблюдением:

В этой парадигме есть «руководитель», который может предоставить необходимые данные, чтобы мы могли сделать выводы.

Эти данные представляют собой форму входных данных и их ожидаемых выходных данных, где входные данные (представленные как X) называются «атрибутами», а выходные данные (представленные y) называются целью.

Затем машина (или алгоритм) может сделать выводы на основе предоставленных данных и создать «модель», описывающую взаимосвязь между входными данными и их ожидаемым результатом.

Тип модели, линейной или другой, определяется типом зависимости между данными и их целью (выходными данными).

Следовательно, «обучение» соответствует изменению параметров модели таким образом, чтобы она лучше прогнозировала данные. Затем цель состоит в том, чтобы улучшить производительность модели, которая определяется тем, насколько близки ее прогнозы к фактическим результатам.

Таким образом, говорят, что модель научилась, когда она точно работает с обучающими данными. Модель можно считать полезной, если она проверена на данных тестирования.

Задачи, которые обычно выполняются при обучении с учителем:

1. Классификация

2. Регрессия

1. Классификация

Классификация — это проблема машинного обучения, в которой модель используется для прогнозирования класса, в котором может находиться точка данных. Класс в основном описывает группу, в которой точки данных или объекты, принадлежащие этой группе, имеют некоторое сходство.

Например. мы решаем, является ли животное кошкой или собакой, основываясь на его характеристиках, таких как размер, морда, мех и т. д.

Следовательно, цель состоит в том, чтобы предсказать дискретный класс или метку (Y) на основе новых входных данных (X) с предположением, что модель была должным образом обучена на обучающих данных. Обучающие данные включают в себя входные данные (X) и их ожидаемый класс/целевой результат (Y), чтобы модель могла «научиться» классифицировать новые данные.

Вот несколько примеров вопроса о том, какая классификация может быть поставлена перед задачей:

Анализ настроений в социальных сетях имеет два возможных результата: положительный или отрицательный, как показано на приведенной ниже диаграмме.

Это кошка или собака?
Он положительный или отрицательный?
На этой диаграмме показана классификация набора данных цветов ириса по трем подвидам, обозначенным кодами 0, 1 и 2.

Классификация снова делится на:

Бинарная классификация
Мультиклассовая классификация

Бинарная классификация:

Это задача классификации входных данных по двум целевым классам. Проблемы могут включать в себя предсказание, например, кошка это или собака, или предсказание положительного отзыва или нет.

Многоклассовая классификация:

Это задача классификации входных данных по трем или более целевым классам. Классы сдержанные. Проблемы могут включать в себя предсказание того, какой алфавит содержится на входе (изображении) в случае оптического распознавания символов.

2. Регрессия

Регрессия — это проблема ML, в которой мы предсказываем новое значение (я) Y при определенных входных данных X.

Здесь снова наша задача состоит в том, чтобы отобразить X в Y для функции f, такой, что

Y = f(X).

Эта функция может принимать несколько форм (линейную, полиномиальную и т. д.), что определяется отношением входных данных.

(X) с целевым выходом (Y).

Следовательно, наша цель по-прежнему состоит в том, чтобы принять форму функции f, а затем «оптимизировать» (попытаться подогнать) модель под данные, чтобы она могла приблизительно представлять их.

E.g.

Учитывать:

X= [0, 1, 2, 3, 4, 5]

Y= [-1, 1, 3, 5, 7, 9]

Такое, что существует отношение Y=f(X).

Поскольку у нас есть только Y и X, мы предполагаем линейную связь между Y и X, которую можно определить в виде

Y=w.X + c

Следовательно, f(X)= w.X + c

Здесь w,c может принимать значения от — бесконечности до бесконечности

После экспериментов мы находим значения w и c равными 2 и -1.

Таким образом, функция принимает вид 2X — 1.

Теперь мы можем использовать эту функцию, чтобы предсказать новые значения Y при заданных входных данных X.

Например. для X=6 Y примет значение 11.

Ссылки

Рисунок 1: https://www.digitalvidya.com/blog/supervised-learning/

Диаграмма 1: https://www.simplilearn.com/classification-machine-learning-tutorial

Диаграмма 2: https://www.simplilearn.com/classification-machine-learning-tutorial

Обучение под наблюдением: начало для новичков