Проверка гипотезы

Основной тест

О чем эта статья?

Если вы занимаетесь наукой о данных, очень вероятно, что вы сталкивались или столкнетесь с проверкой гипотез. Эта статья даст вам интуитивное представление об этом.

Предпосылки

· Базовые знания статистики (базовая статистика вывода)

· Основы теории вероятностей

Введение

мы используем выборки для принятия любого решения о населении, и в этом процессе мы предполагаем разные параметры совокупности, это предположение называется статистической гипотезой. И чтобы проверить ее достоверность, мы используем проверку гипотез.

Проверка гипотезы — это стандартная процедура проверки утверждения о свойстве совокупности. Это очень важная часть логической статистики.

Если мы выдвинем какое-либо утверждение или какое-либо предположение, например, существует ли бозон Хиггса или изменился ли уровень безработицы в Индии за последний квартал? тогда это должно быть подтверждено статистически, иначе это не имеет никакого смысла.

Общая идея проверки гипотез заключается в следующем:

Делаем первоначальное предположение.
Сбор данных, которые будут работать как резервная копия сделанного нами утверждения (доказательства).
Основываясь на имеющихся доказательствах или данных, принять решение о том, следует ли отклонить или сохранить первоначальное предположение.

Каждая проверка гипотезы, независимо от параметра популяции, включает в себя три вышеуказанных шага.

Итак, мы узнали, что мы должны проверить гипотезу, но перед ее проверкой мы должны установить ее. Итак, обычно мы устанавливаем две гипотезы:

Нулевая гипотеза
Альтернативная гипотеза

Теперь возникает вопрос, что представляют собой эти две Гипотезы, поэтому давайте посмотрим на их значение:

Нулевая гипотеза (H0) — здесь мы в основном заранее предполагаем, что статистика выборки и параметры генеральной совокупности одинаковы и между ними нет разницы. Это утверждение о параметре совокупности, которое считается истинным до тех пор, пока не будет доказано, что оно ложно.

Альтернативная гипотеза (Ha или H1) — любая гипотеза, обратная нулевой гипотезе.

Давайте поймем это на одном примере, как мы устанавливаем нашу гипотезу:

Возьмем в качестве примера любое производственное предприятие, производящее Минеральную воду. И они утверждают, что в среднем каждая 500-мл бутылка наполнена 500 мл минеральной воды, ни больше, ни меньше.

Мы должны проверить, является ли факт, предоставленный компанией, правдой или нет. Итак, в этом случае сначала мы устанавливаем нашу гипотезу.

H0 → Это не что иное, как то, что заявляет компания. поэтому наш H0 → μ = 500 мл
H1 или Ha →дополняет нулевую гипотезу.

Итак, H1->μ≠500 мл. (это не что иное, как двусторонний тест)

Если бы случайно для H1 > μ > 500 мл, то это был бы не что иное, как правосторонний тест.

тогда как для H1-> μ‹500 мл это был бы левосторонний тест.

Вычисление тестовой статистики

После установки нашей гипотезы мы должны найти значение тестовой статистики, а также проверить, какой метод тестирования можно применить среди:

z-тест, t-тест, x²-тест, f-тест

Например,→ z-критерий применяется, когда n≥30 и известно s.d.

z=(x̄-μ)/sd среднего значения ~N(0,1), тогда как sd среднего значения=σ/√n

Возможные результаты Гипотезы, которую мы установили выше:

Отклонить нулевую гипотезу
Не удалось отвергнуть нулевую гипотезу

Мы должны иметь возможность отвергнуть нашу нулевую гипотезу, чтобы наш статистический тест прошел успешно.

Уровень значимости(α):

Он говорит нам о вероятности ошибки при принятии или отклонении нашей нулевой гипотезы. или мы также можем сказать, что это говорит нам об уровне риска отклонения правильной нулевой гипотезы.

Уровень достоверности (C):

Это просто комплементарность Уровня Значимости.

поэтому C + α = 1, а если α = 5%, то c = 0,95 или 95%

После установки уровня значимости мы должны увидеть, какой тип теста мы можем применить:

Двухвостый (H1 ≠ )
Односторонний (H1 › или ‹)

На приведенной выше диаграмме мы приняли уровень значимости за 0,05, и поскольку он двусторонний, он будет разделен на две части, и из этого мы получим критическое значение для обеих заштрихованных областей. Итак, поскольку мы рассчитали статистическое значение выше, теперь нам просто нужно разместить его на графике и посмотреть, где оно находится. Если она находится в области отклонения, мы просто скажем «Нулевая гипотеза отклонена», иначе, если она находится в области принятия, мы можем сказать, что «нам не удалось отвергнуть нулевую гипотезу».

Та же концепция может быть применена и к право- и левохвостому.

Решение

а) Если |Z| ‹ Zα, тогда как |Z| → расчетное значение Z и Zα → табличное значение Z при α.

В приведенном выше случае мы примем H0.

б) Если |Z| › Zα, мы отклоним наш H0 (это означает, что разница между статистикой выборки и параметром генеральной совокупности значительна.

Ошибка типа 1, ошибка типа 2 и мощность теста

Всякий раз, когда мы проверяем нулевую гипотезу (H0) против альтернативной гипотезы (H1), у нас есть четыре возможности:

H0 принимается, когда H0 истинно. [это соответствует решению, так что это правильно]
H0 отклоняется, когда H0 истинно. [Ошибка типа 1]
H0 принимается, когда H0 имеет значение False. [Ошибка типа 2]
H0 отклоняется, когда H0 имеет значение False. [это соответствует решению, так что это правильно]

Ошибка типа 1

Ничего, кроме того, что мы отвергаем верную нулевую гипотезу.

Вероятность ошибки 1-го типа →α=p(ошибка 1-го рода)

α=p(отклонить H0|H0 истинно)

Ошибка 2 типа

В случае ошибки типа 2 мы принимаем нулевую гипотезу, даже если ее значение равно False.

Вероятность ошибки 1-го типа →β=p(ошибка 2-го типа)

β=p(примите, что H0|H1 верно)

Итак, в основном, теперь мы подошли к моменту, когда мы сделали ошибку, из-за которой мы получили ошибки типа 1 и типа 2, и ни в коем случае мы не можем полностью устранить обе ошибки, поэтому мы постараемся свести их к минимуму, насколько это возможно, но поскольку оба зависят друг от друга, мы не можем минимизировать оба сразу (потому что, если мы минимизируем 1, вероятность типа 2 увеличится, и это не будет лучшим решением, наоборот). мы сведем к минимуму тип 2, так как он более серьезен, чем тип 1

β = свернуть

β = принять H0, когда H0 имеет значение False.

1-β-›вероятность отклонения H0, когда H0 равно False (мы должны каким-то образом сделать это значение как можно большим, чтобы минимизировать β)

1-β говорит нам, насколько хорош или плох наш тест (мощность теста)

если 1-β ~1, то тест работает достаточно хорошо

если 1-β ~ 0, то тест работает плохо

1-β не что иное, как указание на нашу МОЩНОСТЬ ИСПЫТАНИЙ.

Это было мое объяснение проверки гипотез, также я очень новичок в статистике, поэтому, если вы обнаружите какую-либо ошибку, сообщите об этом в комментарии.

Спасибо за уделенное время.

Ссылка :

Учебные материалы Youtube и Almabetter