Краткое введение в основы машинного обучения

Приключение с данными, которое началось с концепции интеллектуального анализа данных, постоянно развивалось с внедрением различных алгоритмов. В ИИ существует множество применимых алгоритмов. Кроме того, ИИ пока активно используется в маркетинге, здравоохранении, сельском хозяйстве, космосе и производстве автономных транспортных средств. Интеллектуальный анализ данных делится на разные модели в зависимости от областей, в которых он используется. Эти модели можно сгруппировать под четырьмя основными заголовками: модель оценки стоимости, модель кластеризации базы данных, анализ ссылок и отклонение различий. Он появляется во многих функциях, таких как обнаружение мошенничества с клиентом или оценка прибыли, которую можно получить от клиента. В этом посте я кратко расскажу о моделях машинного обучения. Надеюсь будет полезно, приятного чтения!

Машинное обучение — это наука (и искусство) программирования компьютеров, чтобы они могли учиться на основе данных (Geron, 2017).

Типы систем машинного обучения

Мы можем классифицировать системы машинного обучения в зависимости от количества и типа контроля, который они получают во время обучения. Это проблема, которая определяет, как данные будут учиться, чтобы они могли делать прогнозы. Есть четыре основные категории:

1. Контролируемое обучение

2. Неконтролируемое обучение

3. Полуконтролируемое обучение

4. Обучение с подкреплением

Да, давайте кратко рассмотрим модели обучения, упомянутые в определении. Вы можете столкнуться с такими понятиями, как контролируемое, неконтролируемое и полуконтролируемое обучение, а также обучение с подкреплением. Эти концепции представляют собой модель обучения, которая решает, что и как модель будет изучать из данных.

Контролируемое обучение

Алгоритм контролируемого обученияобучается на размеченных обучающих данных, помогая прогнозировать результаты для непредсказуемых данных. Для успешного построения правильной модели обучения требуется команда высококвалифицированных специалистов по данным, время и технические знания. Исследователь должен реконструировать модели, чтобы гарантировать, что результат останется верным даже при изменении исходных данных. Классификация и Регрессияпринадлежат к этой учебной группе.

Обучение без учителя

Неконтролируемое обучениепозволяет машинам учиться самостоятельно. Этот тип машинного обучения дает приложениям ИИ возможность изучать и находить скрытые закономерности в больших наборах данных без участия человека. Неконтролируемое обучение признано одним из ключевых методов достижения общего искусственного интеллекта. Кроме того, это относится к использованию алгоритмов искусственного интеллекта (ИИ) для выявления закономерностей в наборах данных, содержащих неклассифицированные или немаркированные точки данных.

В контролируемом обучении есть заранее определенные классы. Однако это не относится к неконтролируемому обучению. Он разделяет результаты на разные кластеры, ища сходства и взаимосвязи между атрибутами в существующих данных. Кластеризация — это неконтролируемая структура обучения.

Контролируемое и неконтролируемое обучение

Один из лучших способов определить разницу между контролируемым и неконтролируемым обучением — посмотреть, как научиться играть в шахматы. Да, играя в шахматы! В этом направлении первым вариантом является обучение игре у мастера. Учебное пособие может научить вас играть в шахматы, объяснив основные правила, назначение каждой фигуры и многое другое. Как только вы узнаете правила игры и каждую фигуру, вы можете практиковаться, играя против тренера. Когда вы слышите пример с шахматами, я слышу, как вы говорите, что было бы разумнее учиться у того, кто знает!

Короче говоря, при контролируемом обучении инструктор помогает вам учиться, давая вам инструкции, было определено, что это поможет вам заранее. Однако при неконтролируемом обучении вы учитесь, только наблюдая. Иногда вы можете понять шахматные ходы, а иногда нет. Это один из недостатков обучения без учителя.

Многие вычислительные методы и алгоритмы используются в процессе обучения с учителем. При выборе алгоритма машинного обучения с учителем учитываются следующие факторы:

Сложность модельной системы пытается изучить,
Смещение и дисперсия, существующие в алгоритме,
Размер обучающих данных,
Точность, неоднородность, избыточность и линейность данных,
Хорошее время для тренировок.

Хотя контролируемое обучение может предложить преимущества для бизнеса, такие как глубокое понимание данных и расширенная автоматизация, вы можете столкнуться с трудностями при создании устойчивых моделей контролируемого обучения. Вот некоторые из этих проблем:

Для правильной настройки моделей обучения с учителем может потребоваться определенный уровень знаний.
Обучение моделей обучения с учителем может занять много времени,
Наборы данных могут иметь высокую вероятность человеческой ошибки, что приводит к неправильному обучению алгоритмов.
В отличие от моделей обучения без учителя, обучение с учителем не может агрегировать или классифицировать данные самостоятельно.

Обучение с частичным учителем

Полууправляемое обучение — это класс контролируемых учебных задач и методов, которые также позволяют использовать немаркированные данные для обучения. Как правило, количество непомеченных данных больше, чем количество помеченных данных. Полууправляемое обучение находится между обучением без учителя (без размеченных данных обучения) и обучением с учителем (с полностью размеченными данными обучения). Многие исследователи машинного обучения обнаружили, что немаркированные данные в сочетании с небольшим количеством размеченных данных могут значительно повысить точность обучения. Другими словами, это метод обучения, созданный с использованием большого количества неразмеченных данных и небольшого количества размеченных данных.

Например, у вас есть большой объем данных; вы выбрали неконтролируемый метод обучения, но хотите получить лучшие результаты, обучая данные с небольшой порцией. Вы понимаете, что небольшая часть, которую вы выделяете при обучении с учителем. Короче говоря, это называется обучением с полуучителем! Типичным примером приложения для полуконтролируемого обучения является классификатор текстовых документов. Это тот тип ситуации, когда полу-контролируемое обучение является идеальным, так как будет почти невозможно найти большие объемы размеченных текстовых документов.

Обучение с подкреплением

Это метод обучения, при котором игрок или «Агент» вмешивается, когда это необходимо. Обучение с подкреплением — это геймификация процесса обучения. В этом типе (неконтролируемого) машинного обучения для обучения системы ИИ используется метод вознаграждения-наказания. Машина вознаграждается, если делает правильный ход, и наказывается, если совершает ошибку. Цель здесь состоит в том, чтобы максимизировать общее вознаграждение. То есть человек, который написал этот алгоритм, присваивает положительные значения желаемым действиям и отрицательные значения нежелательным действиям, чтобы поощрить машину. Таким образом, машина запрограммирована на максимизацию вознаграждения в долгосрочной перспективе для достижения оптимального решения. Таким образом, машина учится поступать правильно, учась на собственных ошибках, не требуя присмотра со стороны человека. Это так просто! В настоящее время он часто используется в таких областях, как движения противника в цифровой игре, соперник в настольной игре, веб-интерфейсы пользователя, автономные транспортные средства, система персонализированных рекомендаций по продуктам, чат-боты, робототехника и т. д.

Обучение с подкреплением на самом деле основано на методе проб и ошибок, логике вознаграждения-наказания. Агент взаимодействует с окружающей средой и принимает окончательное решение. Существует 3 различных алгоритма обучения с подкреплением. Эти типы будут рассмотрены в следующих постах.

Мы поговорили об основных концепциях машинного обучения!

Увидимся в следующем посте!

Рекомендуемые книги

Алпайдин, Э. (2020). Введение в машинное обучение. Кембридж, Массачусетс, США: MIT Press.
Герон А. (2019 г.). Практическое машинное обучение с помощью Scikit-Learn, Keras и TensorFlow: концепции, инструменты и методы создания интеллектуальных систем (2-е изд.). О’Райли.
Бенжио, Ю. (2016). Глубокое обучение. Массачусетский технологический институт Пресс.
Шолле, Ф. (2017 г.). Глубокое обучение с помощью Python. Публикации Мэннинга.

Краткое введение в основы машинного обучения

Типы систем машинного обучения

Вопросы по теме