Что такое машина опорных векторов (SVM)?

Здравствуйте, любители машинного обучения! Эта статья будет посвящена еще одному известному алгоритму классификации, известному как «Машина опорных векторов».

В следующих разделах будут рассмотрены следующие темы:

(1) Что такое метод опорных векторов (SVM)?

(2) Как работает SVM?

(3) Преимущества и недостатки SVM

(4. Вывод

(1) Что такое метод опорных векторов (SVM)?

Как мы обсуждали ранее, SVM — это алгоритм, который используется для решения задач классификации. Цель алгоритма SVM — найти оптимальную гиперплоскость, которая максимально увеличивает разницу между двумя классами. Гиперплоскость — это обобщенный термин для обозначения границы решения в n-мерном пространстве.

На рис. 1 показан алгоритм SVM в действии. Граница решения делит плоскость на 2 половины, поэтому точки данных могут относиться к соответствующим классам.

Теперь, когда мы увидели, как выглядит SVM, давайте посмотрим на работу этого красивого алгоритма.

(2) Как работает SVM?

Прежде чем углубиться в нюансы этого алгоритма, давайте разберемся, что такое «Опорный вектор» в машине опорных векторов.

Опорный вектор — это перпендикулярная линия от границы решения до ближайших точек в обоих классах.

Что означает максимальная маржа в SVM?

Граница решения (жирная линия) на рис. 2 — это то, что разделяет плоскость на две половины для двух классов. Гиперплоскости (положительные и отрицательные) действуют как буфер по отношению к границе решения, так что, когда новый набор точек данных, который может попасть где-то рядом с границей решения, попадает в соответствующий класс. Это одно из преимуществ этого алгоритма, которое недоступно в других алгоритмах, таких как логистическая регрессия, где новая точка данных может быть неправильно классифицирована, если она попадает где-то рядом с границей принятия решения. Таким образом, SVM считается одним из мощных классификаторов в машинном обучении.

Упомянутая выше работа предназначена для линейного SVM (когда набор данных можно разделить на два класса линейной линией). Но что происходит, когда классы не являются линейно разделимыми? Это когда мы используем уловки ядра, где определенные функции используются для преобразования данных, которые не являются линейно разделимыми в n-мерном пространстве, в более высокое измерение, где они линейно разделимы. На рисунке ниже представлен нелинейный SVM.

Если мы внимательно посмотрим, то увидим, что, в отличие от линейного SVM, гиперплоскость не является прямой. Чтобы сделать их линейно разделимыми, необходимо было создать гиперплоскость более высокого измерения. Таким образом, это позволяет сделать обобщенное предположение о данных независимо от сложности признаков.

Теперь, когда мы поняли базовое понимание алгоритма SVM, давайте теперь рассмотрим его преимущества и недостатки.

(3) Преимущества и недостатки SVM

(i) Преимущества SVM

Эффективно обрабатывает нелинейные данные: Как мы видели на примере нелинейного SVM, благодаря хитростям ядра он может создавать гиперплоскости, которые могут эффективно и действенно разделить два класса.
Возможности регуляризации:известно, что SVM имеет регуляризацию L2, которая помогает им предотвратить чрезмерную подгонку.
SVM можно использовать для решения как задач классификации (SVC), так и задач регрессии (SVR). Хотя SVC более предпочтительны и широко используются, чем SVR.
Известно, что SVM эффективно используют память.

(ii) Недостатки SVM

Сложность интерпретации. В отличие от некоторых алгоритмов, таких как деревья решений, SVM сложно анализировать и интерпретировать.
Выбор подходящей функции ядра. Как и в случае решения нелинейной задачи, мы видели, что для решения подобных задач можно использовать определенные приемы ядра. Проблема возникает при выборе правильной функции ядра, чтобы правильная модель соответствовала данным и делались прогнозы.
Обучение этих моделей может занять много времени, если размер набора данных слишком велик.
Настройка этих моделей с помощью гиперпараметров может оказаться сложной задачей.

(4) Заключение

Прочитав эту статью, мы теперь знаем, что такое алгоритм SVM, его внутренняя работа, его преимущества и ограничения. При правильном понимании и применении SVM может стать мощным инструментом в вашем арсенале.

Надеюсь, вам понравилось читать эту статью!!

Что такое машина опорных векторов (SVM)?

(1) Что такое метод опорных векторов (SVM)?

(2) Как работает SVM?

Что означает максимальная маржа в SVM?

(3) Преимущества и недостатки SVM

(i) Преимущества SVM

(ii) Недостатки SVM

(4) Заключение

Вопросы по теме