"Машинное обучение"
Типы ядер в машинном обучении
Решение нелинейной задачи с помощью линейной функции
В этой статье мы поговорим о типах ядер, используемых в машинном обучении для разделения данных нелинейных задач с помощью линейного классификатора. Необработанные данные нуждаются в особой осторожности, чтобы получить на их основе понимание и представление, функции в данных могут быть в любом шаблоне, и нам нужно искать связь между ними.
Анализ паттернов и взаимосвязь могут быть в кластерах, корреляциях, классификациях, рейтингах и т. Д.
Уловка с ядром. Изучение различных ядер использует функцию ядра, которая работает в многомерном пространстве без учета координат данных. Таким образом, этот тип процесса / подхода является более дешевым и эффективным с точки зрения вычислений.
Различные ядра, которые будут охвачены:
1. Linear Kernel 2. Polynomial Kernel 3. Sigmoid Kernel 4. RBF Kernel 5. Laplacian Kernel 6. Chi-squared Kernel
Линейное ядро
Как следует из названия, ядро разделяет данные линейно, поскольку это одномерное ядро. Каждый новичок начинает с этого простого ядра, которое в большинстве случаев является значением алгоритма по умолчанию.
Преимущество линейного ядра в том, что оно быстрое по сравнению с другими ядрами, потому что в линейном ядре нам нужен только параметр регуляризации, а в других ядрах нам нужно добавить параметр y
для выполнения поиска по сетке.
Уравнение линейного ядра показано ниже:
Где,
x и y = входные векторы-столбцы
degree=1
и coef0=0
, если коэффициент равен нулю, тогда ядро однородно, что означает, что оно отображает данные в компактном линейном представлении.
Полиномиальное ядро
Как следует из названия, это ядро имеет дело со степенью / порядком функций. Связь между функциями не является линейной, а скорее кривой, из-за этого линейное ядро не подходит для получения максимального результата, потому что остаток будет больше между наблюдаемым и прогнозируемым значением.
Рабочая функция этого ядра менее эффективна по сравнению с другими ядрами.
Уравнение полиномиального ядра показано ниже:
Где,
x и y = входные векторы-столбцы и d = степень ядра
Сигмовидное ядро
Это ядро в основном используется в нейронных сетях или персептроне в машинном обучении. Для классификации классов в данных он работает как функция активации. Кривая в этом ядре также называется кумулятивной функцией распределения, которая идет от 0 до 1.
Многие люди до сих пор путают функцию logit, функция logit является обратной сигмоидной функции.
Уравнение сигмовидного ядра показано ниже:
Где,
x и y = входные векторы-столбцы, ϒ = наклон и C0 = точка пересечения
Ядро RBF
Наиболее используемое ядро в алгоритме машинного обучения для классификации данных, не зная типов данных, и попытки плавного разделения классов. Полная форма RBF - это ядро радиального базиса.
Внедрение RBF в ядро машинного обучения связано с тем, что другие ядра не пытаются хорошо масштабироваться для огромного количества функций ввода.
Уравнение ядра RBF показано ниже:
Где,
x и y = входные векторы-столбцы, ϒ = ϒ = σ ^ 2, ядро дисперсии.
Лапласовское ядро
Ядро лапласиана принадлежит к семейству ядер RBF и может использоваться в бесшумных данных. На него гораздо меньше влияют изменения данных, а также он имеет некоторые схожие функции с экспоненциальным ядром, о чем мы поговорим позже в этой статье.
Применение этого ядра в основном заключается в обработке изображений для обнаружения краев объектов под названием лапласиана над фильтром Гаусса (LoG).
Уравнение ядра Лапласа показано ниже:
Где,
x и y = входные векторы-столбцы, || x-y || 1 = метрика расстояния Манхэттена
Ядро хи-квадрат
Этот тип ядра полезен в нелинейных данных, он выглядит как ядро пересечения, которое работает с гистограммой данных визуальных слов. Скорость этого ядра низкая и иногда не работает с разреженными данными.
Данные должны быть отличными от нуля и положительными, чтобы иметь хороший результат с этим ядром и в основном использоваться в приложениях компьютерного зрения.
Уравнение ядра хи-квадрат показано ниже:
Заключение:
Это базовый тип ядра, который в основном используется в алгоритме машинного обучения.
Надеюсь, статья вам понравилась. Свяжитесь со мной в моих LinkedIn и twitter.
Рекомендуемые статьи
1. 8 идей для активного изучения модуля Python Collection
2. NumPy: линейная алгебра на изображениях
3. Концепции обработки исключений в Python
4. Pandas: Работа с Категориальные данные
5. Гиперпараметры: RandomSeachCV и GridSearchCV в машинном обучении
6. Полностью объясненная линейная регрессия с Python
7. Полностью объясненная логистическая регрессия с Python < br /> 8. Распределение данных с использованием Numpy с Python
9. Деревья решений против случайных лесов в машинном обучении
10. Стандартизация предварительной обработки данных с помощью Python