Большинство из нас знает, что логистическая регрессия — это алгоритм классификации! Но почему в нем есть слово «регрессия»?

Начнем с основ.

КЛАССИФИКАЦИЯ

Это процесс помещения вещей/предметов в категорию. Когда ты вазу с фруктами. Вы можете разделить все фрукты, классифицируя их по имени, типу или размеру.

Классификация может быть бинарной или мультиклассовой. Бинарная классификация - это когда существует только две категории. Мультикласс — это когда существует более двух категорий.

РЕГРЕССИЯ

Регрессия помогает найти взаимосвязь между одной зависимой и одной или несколькими независимыми переменными. В регрессии значения носят непрерывный характер. Примерами непрерывных значений являются рост, температура, вес и т. д.

НЕЗАВИСИМАЯ ПЕРЕМЕННАЯ vs ЗАВИСИМАЯ ПЕРЕМЕННАЯ

Зависимая переменная — это та, которую мы пытаемся предсказать с помощью регрессии. Независимая переменная (переменные) — это те, которые мы используем для прогнозирования зависимой переменной.

Уравнение, показанное на изображении выше, используется для прогнозирования результатов линейной регрессии. Другими словами, зависимая переменная или целевое значение прогнозируется с использованием независимых переменных или заданных значений в линейной регрессии.

Теперь мы знаем, что регрессия использует непрерывные значения (независимые или заданные значения) для прогнозирования непрерывной переменной (зависимого или целевого значения). Но почему термин "регрессия" используется в названии "алгоритма классификации", когда прогнозируемый результат является дискретным?

ПОЧЕМУ «РЕГРЕССИЯ» ПРИСУТСТВУЕТ В ИМЯ ЛОГИСТИЧЕСКОЙ РЕГРЕССИИ?

Логистическая регрессия использует ту же формулу, что и линейная регрессия. Формула: -

y = m0x0 + m1x1 + .. + c

Разница в том, что эта же формула проходит через СИГМОИД-ФУНКЦИЮ в логистической регрессии перед прогнозированием конечного результата.

В логистической регрессии сигмовидная функция обеспечивает вероятности [0, 1]. Теперь выход (y) таков, что

если у ›= 0,5, то у = 1

если у ‹= 0,5, то у = 0

Логистическая регрессия использует ту же формулу, что и линейная регрессия. Однако эта формула передается через SIGMOID FUNCTION в логистической регрессии. Как мы видим на изображении выше, сигмовидная функция использует непрерывное значение и прогнозирует результат на основе порогового условия. Вот как мы получаем дискретное значение в логистической регрессии.

Несмотря на то, что логистическая регрессия использует ту же формулу, что и линейная регрессия, она предназначена для вероятности определенного результата.