Логистическая регрессия — это метод, который можно использовать как для традиционной статистики, так и для машинного обучения.
Логистическая регрессия аналогична линейной регрессии, за исключением того, что логистическая регрессия предсказывает, является ли что-то истинным или ложным, вместо того, чтобы предсказывать что-то непрерывное, например размер.
Кроме того, вместо подгонки линии к данным логистическая регрессия соответствует S-образной логистической функции.
Кривая идет от 0 до 1, т. е. кривая говорит нам о вероятности этой конкретной точки на кривой.
Логистическая регрессия обычно используется для классификации.
Как и линейная регрессия, логистическая регрессия может работать с непрерывными данными (такими как вес и возраст) и дискретными данными (такими как геном и астрологический знак).
Логистическая регрессия использует Оценку максимального правдоподобия (MLE), чтобы подобрать линию. MLE — это метод, используемый для оценки параметров данного распределения с использованием некоторых наблюдаемых данных.
- Он вычисляет вероятности всех точек, а затем умножает все эти вероятности вместе. Это вероятность данных, заданных этой строкой.
- Затем вы сдвигаете линию и вычисляете новую вероятность данных, а затем снова сдвигаете линию и снова и снова вычисляете вероятность…
- наконец, выбирается кривая с максимальной вероятностью.
Использование сигмовидной функции в логической регрессии.
Причина, по которой мы выбираем сигмоидальную функцию для моделирования задач классификации, решаемых с помощью логистической регрессии, заключается в том, что мы хотим убедиться, что прогнозируемое значение имеет определенный диапазон (т. е. от 0 до 1). что помогает нам различать классы.
Y = 1 / 1+e -z
Таким образом, если значение z стремится к положительной бесконечности, то прогнозируемое значение y станет равным 1, а если оно стремится к отрицательной бесконечности, то прогнозируемое значение y станет равным 0. И если результат сигмовидной функции больше 0,5, тогда мы классифицируем эту метку как класс 1 или положительный класс, и если она меньше 0,5, мы можем классифицировать ее как отрицательный класс или пометить как класс 0.
Разница между линейной регрессией и логистической регрессией
- Линейная регрессия соответствует линии данным, тогда как логистическая регрессия соответствует S-образной логистической/сигмовидной функции.
- Линейная регрессия хороша для прогнозирования непрерывных результатов, таких как заработная плата, цены на жилье и т. д., тогда как логистическая регрессия используется для задач классификации, предсказывающих диапазон вероятностей от 0 до 1.
- С помощью линейной регрессии мы подгоняем линию, используя «наименьшие квадраты»,другими словами, мы находим линию, которая минимизирует сумму квадратов остатков, тогда как логистическая регрессия использует оценку максимального правдоподобия (MLE). чтобы соответствовать линии.
- В линейной регрессии мы также можем использовать остатки для расчета R², чтобы сравнить простые модели со сложными моделями. тогда как в логистической регрессии отсутствует понятие остатков, поэтому мы не можем рассчитать R².
Резюме логистической регрессии-
- Логистическую регрессию можно использовать для классификации выборок.
- Он может использовать различные типы данных (например, размер, геном) для классификации.
- Его можно использовать для оценки того, какие переменные полезны для классификации выборок.
Надеюсь, вам понравилась моя короткая статья о логистической регрессии.
Спасибо!!!!!!