Основной тест
О чем эта статья?
Если вы занимаетесь наукой о данных, очень вероятно, что вы сталкивались или столкнетесь с проверкой гипотез. Эта статья даст вам интуитивное представление об этом.
Предпосылки
· Базовые знания статистики (базовая статистика вывода)
· Основы теории вероятностей
Введение
мы используем выборки для принятия любого решения о населении, и в этом процессе мы предполагаем разные параметры совокупности, это предположение называется статистической гипотезой. И чтобы проверить ее достоверность, мы используем проверку гипотез.
Проверка гипотезы — это стандартная процедура проверки утверждения о свойстве совокупности. Это очень важная часть логической статистики.
Если мы выдвинем какое-либо утверждение или какое-либо предположение, например, существует ли бозон Хиггса или изменился ли уровень безработицы в Индии за последний квартал? тогда это должно быть подтверждено статистически, иначе это не имеет никакого смысла.
Общая идея проверки гипотез заключается в следующем:
- Делаем первоначальное предположение.
- Сбор данных, которые будут работать как резервная копия сделанного нами утверждения (доказательства).
- Основываясь на имеющихся доказательствах или данных, принять решение о том, следует ли отклонить или сохранить первоначальное предположение.
Каждая проверка гипотезы, независимо от параметра популяции, включает в себя три вышеуказанных шага.
Итак, мы узнали, что мы должны проверить гипотезу, но перед ее проверкой мы должны установить ее. Итак, обычно мы устанавливаем две гипотезы:
- Нулевая гипотеза
- Альтернативная гипотеза
Теперь возникает вопрос, что представляют собой эти две Гипотезы, поэтому давайте посмотрим на их значение:
Нулевая гипотеза (H0) — здесь мы в основном заранее предполагаем, что статистика выборки и параметры генеральной совокупности одинаковы и между ними нет разницы. Это утверждение о параметре совокупности, которое считается истинным до тех пор, пока не будет доказано, что оно ложно.
Альтернативная гипотеза (Ha или H1) — любая гипотеза, обратная нулевой гипотезе.
Давайте поймем это на одном примере, как мы устанавливаем нашу гипотезу:
Возьмем в качестве примера любое производственное предприятие, производящее Минеральную воду. И они утверждают, что в среднем каждая 500-мл бутылка наполнена 500 мл минеральной воды, ни больше, ни меньше.
Мы должны проверить, является ли факт, предоставленный компанией, правдой или нет. Итак, в этом случае сначала мы устанавливаем нашу гипотезу.
- H0 → Это не что иное, как то, что заявляет компания. поэтому наш H0 → μ = 500 мл
- H1 или Ha →дополняет нулевую гипотезу.
Итак, H1->μ≠500 мл. (это не что иное, как двусторонний тест)
Если бы случайно для H1 > μ > 500 мл, то это был бы не что иное, как правосторонний тест.
тогда как для H1-> μ‹500 мл это был бы левосторонний тест.
Вычисление тестовой статистики
После установки нашей гипотезы мы должны найти значение тестовой статистики, а также проверить, какой метод тестирования можно применить среди:
z-тест, t-тест, x²-тест, f-тест
Например,→ z-критерий применяется, когда n≥30 и известно s.d.
z=(x̄-μ)/sd среднего значения ~N(0,1), тогда как sd среднего значения=σ/√n
Возможные результаты Гипотезы, которую мы установили выше:
- Отклонить нулевую гипотезу
- Не удалось отвергнуть нулевую гипотезу
Мы должны иметь возможность отвергнуть нашу нулевую гипотезу, чтобы наш статистический тест прошел успешно.
Уровень значимости(α):
Он говорит нам о вероятности ошибки при принятии или отклонении нашей нулевой гипотезы. или мы также можем сказать, что это говорит нам об уровне риска отклонения правильной нулевой гипотезы.
Уровень достоверности (C):
Это просто комплементарность Уровня Значимости.
поэтому C + α = 1, а если α = 5%, то c = 0,95 или 95%
После установки уровня значимости мы должны увидеть, какой тип теста мы можем применить:
- Двухвостый (H1 ≠ )
- Односторонний (H1 › или ‹)
На приведенной выше диаграмме мы приняли уровень значимости за 0,05, и поскольку он двусторонний, он будет разделен на две части, и из этого мы получим критическое значение для обеих заштрихованных областей. Итак, поскольку мы рассчитали статистическое значение выше, теперь нам просто нужно разместить его на графике и посмотреть, где оно находится. Если она находится в области отклонения, мы просто скажем «Нулевая гипотеза отклонена», иначе, если она находится в области принятия, мы можем сказать, что «нам не удалось отвергнуть нулевую гипотезу».
Та же концепция может быть применена и к право- и левохвостому.
Решение
а) Если |Z| ‹ Zα, тогда как |Z| → расчетное значение Z и Zα → табличное значение Z при α.
В приведенном выше случае мы примем H0.
б) Если |Z| › Zα, мы отклоним наш H0 (это означает, что разница между статистикой выборки и параметром генеральной совокупности значительна.
Ошибка типа 1, ошибка типа 2 и мощность теста
Всякий раз, когда мы проверяем нулевую гипотезу (H0) против альтернативной гипотезы (H1), у нас есть четыре возможности:
- H0 принимается, когда H0 истинно. [это соответствует решению, так что это правильно]
- H0 отклоняется, когда H0 истинно. [Ошибка типа 1]
- H0 принимается, когда H0 имеет значение False. [Ошибка типа 2]
- H0 отклоняется, когда H0 имеет значение False. [это соответствует решению, так что это правильно]
Ошибка типа 1
Ничего, кроме того, что мы отвергаем верную нулевую гипотезу.
Вероятность ошибки 1-го типа →α=p(ошибка 1-го рода)
α=p(отклонить H0|H0 истинно)
Ошибка 2 типа
В случае ошибки типа 2 мы принимаем нулевую гипотезу, даже если ее значение равно False.
Вероятность ошибки 1-го типа →β=p(ошибка 2-го типа)
β=p(примите, что H0|H1 верно)
Итак, в основном, теперь мы подошли к моменту, когда мы сделали ошибку, из-за которой мы получили ошибки типа 1 и типа 2, и ни в коем случае мы не можем полностью устранить обе ошибки, поэтому мы постараемся свести их к минимуму, насколько это возможно, но поскольку оба зависят друг от друга, мы не можем минимизировать оба сразу (потому что, если мы минимизируем 1, вероятность типа 2 увеличится, и это не будет лучшим решением, наоборот). мы сведем к минимуму тип 2, так как он более серьезен, чем тип 1
β = свернуть
β = принять H0, когда H0 имеет значение False.
1-β-›вероятность отклонения H0, когда H0 равно False (мы должны каким-то образом сделать это значение как можно большим, чтобы минимизировать β)
1-β говорит нам, насколько хорош или плох наш тест (мощность теста)
если 1-β ~1, то тест работает достаточно хорошо
если 1-β ~ 0, то тест работает плохо
1-β не что иное, как указание на нашу МОЩНОСТЬ ИСПЫТАНИЙ.
Это было мое объяснение проверки гипотез, также я очень новичок в статистике, поэтому, если вы обнаружите какую-либо ошибку, сообщите об этом в комментарии.
Спасибо за уделенное время.
Ссылка :
Учебные материалы Youtube и Almabetter