3 типа машинного обучения в ИИ

Когда мы смотрим на самые разные виды машинного обучения, которые используются на практике в искусственном интеллекте

Исторически сложилось несколько подходов к машинному обучению для ИИ, таких как обучение с учителем, обучение без учителя, обучение с подкреплением, рассуждения на основе конкретных случаев, индуктивное логическое программирование, обобщение на основе опыта и т. д. Было несколько примеров волн машинного обучения для различных целей. Проблемы с ИИ. Но из них 3 наиболее важные категории машинного обучения, которые сегодня имеют практическое применение или использование в бизнесе, таковы:

1. Контролируемое обучение

2. Неконтролируемое обучение

3. Обучение с подкреплением

Давайте рассмотрим каждый из них отдельно, и у нас будет краткий обзор каждого из них, чтобы у нас было представление о том, о чем мы говорим.

3. Контролируемое обучение

на сегодняшний день является наиболее зрелой и, вероятно, в некотором смысле самой простой формой машинного обучения. Идея здесь в том, что у вас есть исторические данные с некоторым понятием выходной переменной. Что такое выходная переменная? Выходная переменная предназначена для определения того, как вы можете получить хорошую комбинацию нескольких входных переменных и соответствующих выходных значений в виде исторических данных, представленных вам, а затем на основе этого вы пытаетесь придумать функцию, которая способна предсказать результат с учетом любого ввода. Итак, ключевая идея заключается в том, что исторические данные помечены. Помеченный означает, что у вас есть определенное выходное значение для каждой строки данных, которые ему представлены. Таким образом, в этом смысле проблема обучения с учителем заключается в том, что вы действительно можете работать только тогда, когда у вас есть четко размеченные данные с входными и выходными значениями всех исторических данных, которые вам представлены. Затем, когда у вас есть исторические данные с их несколькими входными переменными с их значениями и соответствующим выходным значением, представленным у вас, вы можете использовать это, чтобы вывести своего рода потенциальную функцию между входом и выходом, и функция может быть фактически использована для любого заданного ввода. который поступает и угадывает соответствующий вывод, независимо от того, является ли вывод дискретным или непрерывным, не имеет значения. Оба обучаются под наблюдением.

В частности, в случае выходной переменной, если выходная переменная дискретна, она называется КЛАССИФИКАЦИЯ. А если она непрерывна, то называется РЕГРЕССИЯ. Итак, в случае классификации формула функции принимает новые входные данные и классифицирует их в одно из дискретных возможных выходных значений, или в случае РЕГРЕССИИ мы берем входные значения и даем соответствующее непрерывное значение на выходе. . Таким примером может быть КЛАССИФИКАТОР СПАМА, который берет входные данные, а затем классифицирует их как спам или не спам. Примером непрерывных данных может быть прогноз акций, когда вы просматриваете множество данных из истории до потенциальных цен акций с различными условиями, прогнозируете точное значение и получаете выходную функцию, а затем используете ее для создания нового сценария, где в новом случае, с другими условиями среды, рассчитывается цена акции.

Итак, что происходит в контролируемом, так это то, что вы можете позволить себе роскошь пометить исторические входные и выходные данные.

2. ОБУЧЕНИЕ БЕЗ КОНТРОЛЯ

Неконтролируемое обучение НЕ имеет такой роскоши, как ввод-вывод исторических данных и т. д. Вместо этого мы можем только сказать, что оно имеет целую кучу входных данных, НЕОБРАБОТАННЫЕ ВХОДНЫЕ ДАННЫЕ. Так что же дает вам это обучение без учителя?

Это позволяет нам идентифицировать то, что известно как шаблоны в исторических входных данных, и позволяет нам идентифицировать интересные идеи с общей точки зрения интересного шаблона или понимания исходных входных данных. Таким образом, нет явного уравнения или шаблона, отражающего взаимосвязь между входом или выходом. Итак, выход здесь отсутствует, и все, что вам нужно понять, это то, что в неконтролируемом наборе входных данных виден шаблон.

Например, предположим, что вы пытаетесь определить в большом наборе транзакций супермаркета, какие 2 предмета часто покупаются вместе? Выхода здесь нет. Мы говорим только о том, что представляют собой набор предметов, которые часто покупаются вместе? Таким образом, это похоже на извлечение часто встречающихся элементов вместе. Итак, это не означает маркировку, у него есть только явные входы, а не выход. Затем все входные данные обрабатываются неконтролируемым алгоритмом, а затем извлекается шаблон.

Прелесть неконтролируемого обучения в том, что оно поддается множеству комбинаций паттернов, и проблема в том, что из-за его разнообразной природы не существует единого понятия данных,

Один паттерн в одном контексте что-то означает, в другом контексте данных он может означать другой паттерн. Таким образом, не существует стандартизированного понятия о том, что такое хороший неконтролируемый алгоритм. Вот почему неконтролируемые алгоритмы сложнее, проблемы сложнее и с ними труднее справиться.

3. ПОДДЕРЖИВАЕМОЕ ОБУЧЕНИЕ

Обучение с подкреплением (RL) — это область ML, связанная с тем, как программные агенты должны действовать в среде, чтобы максимизировать некоторое понятие совокупного вознаграждения.

Там, где обычно вам требуется достичь некоторого целевого состояния, и возможно, вы знаете, что сделали целый ряд шагов по мере продвижения от начальной позиции к цели, которая является конечной позицией, и есть несколько шагов между ними и в конце. каждый шаг, вы можете выполнить несколько действий. Итак, что происходит, так это то, что есть некоторое понятие начальной функции (начальное состояние), есть некоторое понятие целевого состояния, а затем есть несколько состояний посередине, где в каждом состоянии вы можете выполнить несколько действий. Возможность множественных действий в каждом состоянии, и каждое действие имеет соответствующее вознаграждение или наказание. Итак, что происходит с этим понятием, так это то, что, поскольку мы говорим о наборе состояний, одно в начальном состоянии, одно в конечном состоянии, множественные целевые состояния, а не одно, тогда каждое состояние имеет соответствующее сопоставление действию с соответствующим вознаграждением или наказание. Таким образом, в конечном счете, обучение с подкреплением позволяет машине или агенту совершать шаги и переходить из одного состояния в другое и предпринимать действия на каждом шаге, где оно переходит в другое состояние и предпринимает действия на следующем шаге. Но по мере того, как вы продолжаете продвигаться вперед, он собирает результаты на основе опыта, независимо от того, является ли он положительным или отрицательным, поощряемым или наказывающим. Основываясь на этом, он оптимизирует предпринятые шаги и выбранный путь и постепенно увеличивает свои знания о том, какой путь, вероятно, является лучшим с точки зрения лучшего вознаграждения, с точки зрения более быстрого достижения цели или выполнения задачи быстрее.

Таким образом, в этом смысле обучение с подкреплением является динамичным, зависимым от состояния и постоянно обновляет награды и наказания, а также постоянно учится на опыте. Таким образом, в этом смысле истории может не быть в начале, но история строится по мере того, как она дает через действия, состояния, награды, наказания на каждом этапе. Итак, классическим примером этого является ОБУЧЕНИЕ В ЛАБИРИНТЕ, где начальный агент начинает с начальной точки, чтобы закончить с различными препятствиями, которые он создает в качестве наказания, и он переобучает себя. И в дальнейшем запоминает и пытается пройти пути, которые не ведут к потенциальной блокировке. Итак, что происходит, если вы пытаетесь достичь цели быстрее, вспоминая ходы, которые не ведут вас к цели, а вместо этого ведут вас к помехе, и эти знания накапливаются здесь. Обучение с подкреплением динамически продолжает обновлять знания о вознаграждениях и наказаниях и создает систему, которая способна учиться на опыте и становиться оптимальной для достижения цели.

Таким образом, эти 3 широкие категории составляют основу современных систем ИИ, где машинное обучение встроено в системы ИИ.