Всем привет !!! Надеюсь, у вас все отлично. Сегодня мы познакомимся с SVM и попытаемся собрать всю важную информацию о нем, а также рассмотрим его математическую реализацию.

Итак, темы, которые я собираюсь здесь затронуть, таковы:

1) Что такое SVM?

2) Зачем нам нужен SVM?

3) Параметры настройки и ее математические формулы -

i) Ядра

ii) Регуляризация

iii) Гамма

4) приложение SVM

Итак, начнем.

1) Что такое SVM?

Машина опорных векторов, сокращенно SVM, является одним из алгоритмов машинного обучения с учителем, который используется для анализа данных в задачах классификации и регрессии. Теперь для тех, кто не знает, что такое алгоритм обучения с учителем, я поделюсь ссылкой ниже, я предлагаю вам сначала пройти его.

https://medium.com/@msdasila90/get-the-basics-of-machine-learning-754a75c8ae08

Теперь мы поймем, для чего используется SVM и как он помогает нам в прогнозировании модели.

2) Зачем нам нужен SVM?

Как вы можете видеть на диаграмме выше, у нас есть красная точка и синяя точка, и одна линия разделяет их. Таким образом, эти точки называются векторами, а линия или граница, разделяющая их, называется гиперплоскостью.

Таким образом, концепция SVM заключается в том, что здесь мы должны найти наилучшую линию соответствия, которая наилучшим образом разделяет классифицированный вектор. И говоря «наилучшим образом», это означает, что расстояние между опорными векторами и гиперплоскостью должно быть максимальным.

Теперь, что такое опорные векторы?

Опорные векторы — это векторы, которые находятся ближе всего к гиперплоскости или линии.

Не волнуйтесь, если вы не поняли идею, я беру пример, тогда вам определенно будет ясно.

Теперь посмотрите, что приведенная выше диаграмма является примером линии наилучшего соответствия или, можно сказать, гиперплоскости наилучшего соответствия.

Давайте посмотрим на мульти гиперплоскость.

Теперь из этих разных гиперплоскостей, разделяющих или разделяющих векторы, мы должны увидеть максимальный запас, то есть мы должны увидеть максимальное расстояние между линией и опорными векторами.

Надеюсь, вы разобрались с концепцией.

3) Параметры настройки и ее математические формулы -

i) Ядра

Теперь давайте поговорим об особенностях SVM, т. е. ядрах. Методы нулевого ядра — это класс алгоритмов, которые используются для анализа шаблона. Мы также можем сказать, что ядро ​​​​помогает нам более четко и точно визуализировать разделение данных, что в конечном итоге помогает нам выбрать подходящую линию ставки.

Итак, какие бывают типы ядер?

Теперь давайте посмотрим на его визуализацию.

Как вы можете ясно видеть, разные способы разделения с использованием разных ядер.

ii) Регуляризация

Параметр Regularization (часто называемый параметром C в библиотеке Python sklearn) сообщает оптимизации SVM, насколько вы хотите избежать неправильной классификации каждого обучающего примера.

Для больших значений C оптимизация выберет гиперплоскость с меньшим полем, если эта гиперплоскость лучше справляется с правильной классификацией всех обучающих точек. И наоборот, очень маленькое значение C заставит оптимизатор искать разделяющую гиперплоскость с большей границей, даже если эта гиперплоскость ошибочно классифицирует больше точек.

Смотрите пример -

iii) Гамма

Гамма-параметр говорит нам, какие точки данных мы можем выбрать. Для низких значений гаммы учитываются также дальние точки, но для высокого значения гаммы учитываются только близлежащие точки.

4) приложения SVM

Что ж, SVM можно использовать в любой задаче классификации, лишь немногие из них —

1) Классификация изображений

2) Распознавание рукописных цифр

3) Предсказание рака

Вот и все, надеюсь, статья окажется вам полезной. Также ставьте лайки и комментируйте, если вы нашли это полезным.

Мир!!!

Махеш Сингх Дасила