ТЕХНИЧЕСКИЕ

Парадигмы машинного обучения

Введение в концепции машинного обучения

Машинное обучение (ML) – это приложение, в котором алгоритмы могут учиться на собственном опыте без явного программирования. У нас есть входные данные, которые мы хотим, чтобы наш алгоритм исследовал, и алгоритм возвращает выходные данные. на основе того, что он узнал из нашего ввода.

Компонент обучения — это то, что делает машинное обучение уникальным. Это почти как черный ящик, который принимает входные данные, творит магию внутри и выводит значения, которые мы хотим предсказать.

Тем не менее, как и у людей, у машин могут быть разные подходы к изучению материала. Эти различные подходы называются парадигмами машинного обучения и помогают нам понять, как компьютер учится на данных, а именно на входных данных.

Существует три основных парадигмы машинного обучения:

  1. Обучение с подкреплением

2. Обучение под наблюдением

3. Неконтролируемое обучение

Обучение с подкреплением

В психологии подкрепление — это термин, обозначающий «все, что увеличивает вероятность того, что реакция будет иметь место»(Вишенка). Давайте разберемся на примере.

Допустим, вы хотите научить свою кошку Нэнси сидеть. Когда Нэнси садится, вы вознаграждаете ее угощением. В конце концов она узнает, что сидение — это действие, которое приносит ей что-нибудь вкусненькое, поэтому она учится сидеть с намерением получить награду.

Когда этот психологический феномен применяется к машинному обучению, машины наблюдают за окружающей средой, принимают решения о своих действиях и получают взамен вознаграждение или наказание. При этом алгоритмы узнают, что делать, чтобы оптимизировать свои решения на основе этих наказаний и вознаграждений. Эта система обучения называется агент.

Одним из наиболее распространенных примеров обучения с подкреплением является игра в шахматы против компьютера. Забавный факт: AlphaGo, компьютерная программа, разработанная DeepMind, — это первый компьютер, который смог победить чемпиона мира по шахматам!

Если вы хотите узнать больше, я рекомендую этот источник.

Контролируемое обучение

Обучение с учителем означает, что обучающие данные, которыми мы кормим наш алгоритм, имеют метки. В результате он сопоставляет входные данные (обучающие данные) с выходными и соответствующим образом маркирует данные. Обычно его представляют в виде таблицы.

Есть две контролируемые учебные задачи:

Классификация

Модель присваивает категорию целевой переменной. Целевая переменная — это категория, которую должен найти ваш алгоритм.

Если у вас есть данные о пациентах и ​​вы хотите предсказать, есть ли у кого-то болезнь сердца или нет, ваша модель делает прогнозы на основе данных, используя такие функции, как пол пациента, возраст и т. д., и присваивает категорию (в данном случае да или нет). ) к целевой переменной (болезнь сердца). Это будет выглядеть примерно так:

Другие известные примеры включают в себя прогнозирование того, является ли электронное письмо спамом или нет, и, учитывая рукописные цифры, классифицировать, какая цифра является данным вводом.

Регрессия

Модель присваивает непрерывную переменную целевой переменной. Допустим, у вас есть данные о прошлых ценах на акции, и вы хотите предсказать цену на завтра. Вы не можете назначить определенную категорию целевой переменной, как в приведенном выше примере, поэтому вам следует предсказать определенное значение для каждой строки в целевом столбце.

Другими примерами регрессии могут быть прогнозирование роста, веса или погоды.

Неконтролируемое обучение

В неконтролируемом обучении у нас нет столбца для целевой переменной — мы на самом деле не знаем, что ищем.

Мы рассмотрим пример, чтобы понять, что это значит.

Допустим, вы работаете в компании, и вас просят классифицировать различных ваших клиентов, чтобы компания могла улучшить свои маркетинговые стратегии. Тем не менее, вы не знаете, как создавать эти категории. Кластеризация определяет поведение потребления каждой категории и определяет, сколько групп у нас должно быть и кто должен быть помещен в каждую группу. Таким образом, наши модели делят набор данных в соответствии с его сходством. Это называется кластеризация, подкатегория неконтролируемого обучения.

Резюме

Спасибо за чтение! Дайте мне знать, если у вас есть какие-либо отзывы :)

Ресурсы:

Черри, Кендра. Что такое подкрепление и как оно используется в психологии? Verywell Mind, www.verywellmind.com/what-is-reinforcement-2795414.