Пробит и логистическая регрессия — это два статистических метода, используемых для анализа данных с бинарными или категориальными результатами. Оба метода имеют аналогичную цель моделирования взаимосвязи между бинарной переменной отклика и набором переменных-предикторов, но они различаются своими предположениями и интерпретацией.

Пробит-регрессия предполагает, что бинарная переменная отклика следует нормальному распределению, тогда как логистическая регрессия предполагает, что она следует логистическому распределению. Эта разница в предположениях о распределении может повлиять на форму оценочной взаимосвязи между предикторами и переменной отклика.

Пробит-регрессия оценивает вероятность того, что двоичная переменная отклика будет равна единице (или нулю) при заданном наборе переменных-предикторов, предполагая нормальное распределение для переменной отклика. Предполагаемая взаимосвязь между предикторами и переменной отклика обычно представлена ​​как изменение стандартного отклонения переменной отклика при изменении переменной предиктора на одну единицу. Это делает интерпретацию коэффициентов пробит-регрессии более сложной, чем коэффициентов логистической регрессии.

Логистическая регрессия оценивает логарифмические шансы бинарной переменной ответа, равные единице (или нулю) при заданном наборе переменных-предикторов, предполагая логистическое распределение для переменной ответа. Предполагаемая взаимосвязь между предикторами и переменной отклика обычно представлена ​​как изменение логарифмических шансов переменной отклика при изменении переменной предиктора на одну единицу. Это делает интерпретацию коэффициентов логистической регрессии более простой и интуитивно понятной, чем коэффициенты пробит-регрессии.

Еще одно различие между пробит-регрессией и логистической регрессией заключается в том, что пробит-регрессия предполагает, что ошибки распределяются нормально, а логистическая регрессия предполагает, что ошибки независимы и одинаково распределены. Это может повлиять на выбор используемого метода в зависимости от предположений о распределении данных.

Когда использовать пробит-регрессию

Пробит-регрессия часто используется, когда переменная отклика непрерывна и предположение о нормальности разумно. Это также полезно, когда связь между предикторами и переменной отклика нелинейна или если имеется много предикторов.

Например, пробит-регрессию можно использовать для анализа данных о риске конкретного заболевания с учетом набора факторов риска, таких как возраст, пол и семейный анамнез. В этом случае переменная ответа (статус болезни) может быть смоделирована как непрерывная переменная с нормальным распределением.

Когда использовать логистическую регрессию

Логистическая регрессия часто используется, когда переменная отклика является бинарной или категориальной, и предположение о нормальности нецелесообразно. Это также полезно, когда связь между предикторами и переменной отклика является линейной или если предикторов мало.

Например, логистическую регрессию можно использовать для анализа данных о вероятности покупки клиентом продукта с учетом набора демографических и поведенческих факторов, таких как возраст, доход и активность на веб-сайте. В этом случае переменная ответа (статус покупки) является бинарной или категориальной, что делает логистическую регрессию более подходящим выбором, чем пробит-регрессия.

Заключение

Пробит и логистическая регрессия — это два статистических метода, используемых для анализа данных с бинарными или категориальными результатами. Хотя оба метода имеют сходную цель моделирования взаимосвязи между предикторами и переменной отклика, они различаются своими предположениями и интерпретацией. Пробит-регрессия предполагает, что переменная отклика следует нормальному распределению, а логистическая регрессия предполагает, что она следует логистическому распределению. Выбор между пробит- и логистической регрессией зависит от конкретных характеристик данных и решаемого вопроса исследования.