Общее определение машинного обучения таково: машинное обучение заставляет компьютеры учиться на данных и предпринимать необходимые действия на основе данных без их явного программирования.

Предположим, вы хотите научить трехлетнего ребенка отличать яблоко от других фруктов. Каждый раз, когда вы выбираете фрукт и говорите «Яблоко», если это яблоко, а если нет, вы говорите «Не яблоко». Вы делаете это несколько раз, в машинном обучении это называется «обучение модели», и наша задача - классифицировать данные по двум классам: Apple и Not an Apple. После тренировки вы хотите проверить, научился ли ребенок. Теперь вы выбираете любой случайный фрукт и спрашиваете его или ее «какой это фрукт?» и на основе ответа вы оцените, насколько хорошо он усвоил. Процесс оценки модели называется «Тестирование модели». В этом процессе мы наблюдаем за ребенком. Этот тип обучения называется обучением с учителем.

Есть три типа проблем машинного обучения:

  1. Контролируемое обучение: здесь, как в примере выше, у нас есть данные, которые действуют как учитель, или мы можем сказать, что заранее знаем, что такое целевая переменная (Apple или не Apple).

Если целевая переменная является дискретной, тогда эта проблема машинного обучения будет называться «Классификация», а если целевая переменная является непрерывной, то эта проблема машинного обучения будет называться «Регрессия». Примером регрессии является прогноз цены дома на основе заданных характеристик дома (например, количества спален, количества туалетов, местоположения дома).

2. Обучение без учителя: здесь у вас будут данные, но не целевая переменная, вам нужно будет найти скрытые закономерности из данных или скрытых целевых переменных.

Наиболее распространенный пример обучения без учителя - это разделение клиентов на разные группы в зависимости от их покупательских предпочтений, как если бы вы поместили всех клиентов в одну группу, которая любит покупать одежду в Интернете, а вы поместили бы всех клиентов в другую, которая больше заинтересована в покупке электронных товаров. гаджеты онлайн, и им будут показаны рекомендации в зависимости от их интересов.

3: Обучение с подкреплением: этот тип проблемы машинного обучения основан на механизме обратной связи, каждое неправильное действие имеет связанный с ним штраф, а каждое правильное действие имеет вознаграждение. Программные агенты вроде бы остаются в среде, и они пытаются учиться на основе своих собственных действий, каждый раз в соответствии с обратной связью они пытаются максимизировать вознаграждение и минимизировать штраф.

Давайте разберемся в этом на примере - вы обучаете крысу есть сыр, крыса находится в коробке с двумя дверцами, одна дверь ведет к концу, который поражает электрическим током, а другая дверь имеет сыр. Каждый раз, когда крыса идет не в ту дверь, она поражает электрическим током, что здесь является штрафом, и каждый раз, когда крыса идет к правильной двери, она награждается сыром. Здесь Крыса изначально выберет любую случайную дверь и получит штраф или награду в зависимости от этого, после нескольких симуляций она попытается не перейти к двери, на которой есть штраф. Это обучение с подкреплением.

Спасибо за прочтение!