При проведении теста значимости или проверки гипотезы есть два числа, которые легко запутать. Эти числа легко спутать, потому что они оба являются числами между нулем и единицей и оба являются вероятностями. Одно число называется значением p тестовой статистики. Другое количество интересов — это уровень значимости или альфа(α). Мы рассмотрим эти две вероятности и определим разницу между ними.

Проверка гипотезы

Существует два типа гипотез, а именно:

  1. Нулевая гипотеза
  2. Альтернативная гипотеза

Нулевая гипотеза теста всегда предсказывает отсутствие эффекта или взаимосвязи между переменными.
Альтернативная гипотеза утверждает ваш исследовательский прогноз эффекта или взаимосвязи.

При проведении теста значимости или проверки гипотезы есть два числа, которые легко запутать. Эти числа легко спутать, потому что они оба являются числами между нулем и единицей и оба являются вероятностями. Одно число называется значением p тестовой статистики. Другое количество интересов — это уровень значимости или альфа(α). Мы рассмотрим эти две вероятности и определим разницу между ними.

Существует два типа гипотез, а именно:

  • Нулевая гипотеза
  • Альтернативная гипотеза

Нулевая гипотеза теста всегда предсказывает отсутствие эффекта или взаимосвязи между переменными.
Альтернативная гипотеза утверждает ваш исследовательский прогноз эффекта или взаимосвязи.

При проверке гипотез возможны две ошибки: ошибки типа I и типа II.
ошибка типа I: поддержка альтернативная гипотеза, когда нулевая гипотеза верна.
Ошибка второго рода: отсутствие поддержки альтернативной гипотезы, когда альтернативная гипотеза верна.

Альфа-значения

Число альфа(𝛂) — это пороговое значение, относительно которого мы измеряем p-значения. Он говорит нам, насколько экстремальными должны быть наблюдаемые результаты, чтобы отвергнуть нулевую гипотезу теста значимости.

Значение альфа(𝛂) связано с уровнем достоверности нашего теста.

Пример:

Для результатов с 90-процентным уровнем достоверности значение альфа(𝛂) равно

1–0.90 = 0.10.

Как правило, для результатов с процентным уровнем достоверности «C» значение альфа(𝛂) равно 1-(C/100).

Наиболее часто используемое значение альфа (𝛂) составляет 0,05 или 5 %. Причина этого заключается как в том, что консенсус показывает, что этот уровень уместен во многих случаях, так и в том, что исторически он был принят в качестве стандарта.

Альфа-значение дает нам вероятность ошибки типа I ошибки. Ошибки типа I возникают, когда мы отвергаем нулевую гипотезу, которая на самом деле верна. Таким образом, в долгосрочной перспективе для теста с уровнем значимости 0,05 = 1/20 истинная нулевая гипотеза будет отклонена один раз из каждых 20.

Почему обычно используется альфа-уровень 0,05?

Учитывая, что уровень альфа(α) представляет собой вероятность совершения ошибки первого рода, представляется логичным сделать эту область равной крошечный насколько это возможно. Например, если мы установим уровень альфа(α) равным 10 %, то существует большая вероятность того, что мы можем ошибочно отвергнуть нулевую гипотезу. , а уровень альфа (α), равный 1 %, сделал бы область крошечной. Так почему бы не использовать крошечную площадь вместо стандартных 5%?

Чем меньше уровень альфа(α), тем меньше область, в которой вы бы отклонили нулевую гипотезу. Поэтому, если у вас крошечная область, больше шансов, что вы НЕ отвергнете нулевую гипотезу, хотя на самом деле должны были бы. Это ошибка типа II. Другими словами, чем больше вы пытаетесь избежать ошибки типа I, тем больше вероятность появления ошибки типа II. Ученые обнаружили, что альфа( α) уровень 5 % — хороший баланс между этими двумя вопросами.

P-значения

p-значение также является вероятностью. Каждая тестовая статистика имеет соответствующую вероятность или p-значение. Это значение представляет собой вероятность того, что наблюдаемая статистика возникла случайно, при условии, что нулевая гипотеза верна.

Поскольку существует множество различных тестовых статистических данных, существует несколько различных способов найти значение p. В некоторых случаях нам необходимо знать распределение вероятностей населения.

p-значение тестовой статистики – это способ сказать, насколько экстремальна эта статистика для наших выборочных данных. Чем меньше значение p, тем более маловероятен наблюдаемый образец.

Разница между P-значением и альфа-значением

Чтобы определить, является ли наблюдаемый результат статистически значимым, мы сравниваем значения альфа(α) и значение p. Возникают две возможности:

  • p-значение меньше или равно альфа(α). В этом случае мы отвергаем нулевую гипотезу. Когда это происходит, мы говорим, что результат статистически значим. Другими словами, мы достаточно уверены, что есть что-то помимо случайности, что дает нам наблюдаемую выборку.
  • p-значение больше, чем альфа(α). В этом случае мы не можем отвергнуть нулевую гипотезу. Когда это происходит, мы говорим, что результат не является статистически значимым. Другими словами, мы достаточно уверены, что наблюдаемые нами данные могут быть объяснены только случайностью.
  1. Следствием вышеизложенного является то, что чем меньше значение альфа(α), тем труднее утверждать, что результат является статистически значимым.
  2. С другой стороны, чем больше значение alpha(α), тем легче утверждать, что результат является статистически значимым.

Ссылки: