Определите гиперплоскость, которая отделяет точки Y=0 от точек Y=1.
Используйте эту гиперплоскость, чтобы предсказать классификацию будущих наблюдений.
Уловка ядра
Исходные данные — которые не могут быть разделены плоскостью
Используя трюк с ядром, мы добавили к этим данным дополнительное измерение. Точки Y=1 перемещаются в другую плоскость в этом дополнительном измерении. Теперь эти данные становятся линейно разделимыми.
Типы функций ядра
- Линейный: размеры не добавляются
- Полиномиальный: проецирует в N-мерное пространство. N - пользовательский ввод
- Гауссова (радиальная базисная функция): проецирует в бесконечномерное пространство.
- сигмовидная
RBF — наиболее часто используемая функция
Использование SVM
- Распознавание отпечатков пальцев
- Распознавание лица
Настройка параметров для подбора модели SVM
- C Значение
- Гамма-значение
Мягкая маржа — допущение того, что несколько наблюдений могут быть неправильно классифицированы, чтобы уменьшить вычислительные накладные расходы и сложность модели. Это позволяет некоторым выбросам существовать в данных. Это передается как C-значение в функции GridSearchCV.
Дисперсия — передается как значение гаммы.