Большинство из нас знает, что логистическая регрессия — это алгоритм классификации! Но почему в нем есть слово «регрессия»?
Начнем с основ.
КЛАССИФИКАЦИЯ
Это процесс помещения вещей/предметов в категорию. Когда ты вазу с фруктами. Вы можете разделить все фрукты, классифицируя их по имени, типу или размеру.
Классификация может быть бинарной или мультиклассовой. Бинарная классификация - это когда существует только две категории. Мультикласс — это когда существует более двух категорий.
РЕГРЕССИЯ
Регрессия помогает найти взаимосвязь между одной зависимой и одной или несколькими независимыми переменными. В регрессии значения носят непрерывный характер. Примерами непрерывных значений являются рост, температура, вес и т. д.
НЕЗАВИСИМАЯ ПЕРЕМЕННАЯ vs ЗАВИСИМАЯ ПЕРЕМЕННАЯ
Зависимая переменная — это та, которую мы пытаемся предсказать с помощью регрессии. Независимая переменная (переменные) — это те, которые мы используем для прогнозирования зависимой переменной.
Уравнение, показанное на изображении выше, используется для прогнозирования результатов линейной регрессии. Другими словами, зависимая переменная или целевое значение прогнозируется с использованием независимых переменных или заданных значений в линейной регрессии.
Теперь мы знаем, что регрессия использует непрерывные значения (независимые или заданные значения) для прогнозирования непрерывной переменной (зависимого или целевого значения). Но почему термин "регрессия" используется в названии "алгоритма классификации", когда прогнозируемый результат является дискретным?
ПОЧЕМУ «РЕГРЕССИЯ» ПРИСУТСТВУЕТ В ИМЯ ЛОГИСТИЧЕСКОЙ РЕГРЕССИИ?
Логистическая регрессия использует ту же формулу, что и линейная регрессия. Формула: -
y = m0x0 + m1x1 + .. + c
Разница в том, что эта же формула проходит через СИГМОИД-ФУНКЦИЮ в логистической регрессии перед прогнозированием конечного результата.
В логистической регрессии сигмовидная функция обеспечивает вероятности [0, 1]. Теперь выход (y) таков, что
если у ›= 0,5, то у = 1
если у ‹= 0,5, то у = 0
Логистическая регрессия использует ту же формулу, что и линейная регрессия. Однако эта формула передается через SIGMOID FUNCTION в логистической регрессии. Как мы видим на изображении выше, сигмовидная функция использует непрерывное значение и прогнозирует результат на основе порогового условия. Вот как мы получаем дискретное значение в логистической регрессии.
Несмотря на то, что логистическая регрессия использует ту же формулу, что и линейная регрессия, она предназначена для вероятности определенного результата.