Прежде чем углубляться в эту тему, нужно четко понимать разницу между средним значением по совокупности и средним по выборке.

Нулевая гипотеза (H0) — это заявленное предположение об отсутствии различий в параметрах (среднее значение, дисперсия) для двух или более совокупностей. Согласно нулевой гипотезе, любое наблюдаемое различие в выборках обусловлено случайностью или ошибкой выборки.

Альтернативная гипотеза (Ha) — это утверждение о том, что наблюдаемое различие или взаимосвязь между двумя совокупностями являются реальными, а не результатом случайности или ошибки при выборке.

Проверка гипотез — это процесс использования различных статистических инструментов для анализа данных и, в конечном счете, для отклонения или отклонения нулевой гипотезы. С практической точки зрения, нахождение статистических доказательств того, что нулевая гипотеза ложна, позволяет вам отклонить нулевую гипотезу и принять альтернативную гипотезу.

Статистическая значимость — это вероятность отклонения нулевой гипотезы (т. е. вывода о наличии различий между указанными совокупностями или выборками), если она верна. Уровень значимости обозначается как альфа α.

Доверительный интервал – это тип интервальной оценки, вычисляемой на основе статистики наблюдаемых данных, которая может содержать истинное значение неизвестного параметра генеральной совокупности.

p-значение — это вероятность того, что ваша выборка могла быть взята из тестируемой совокупности (или что могла быть взята менее правдоподобная выборка) при условии, что нулевая гипотеза верна. Значение p, равное 0,05, означает, что у вас будет только 5-процентный шанс получить проверяемую выборку, если нулевая гипотеза действительно верна.

При проверке гипотез вычисленное значение p сравнивается с установленным уровнем значимости, или альфа, чтобы определить, следует ли отклонить или принять нулевую гипотезу.

Пример: –среднее значение населения = 25 | Размер выборки=30 | Среднее значение выборки = 28

  • H0: «среднее значение равно 25»
  • Ха: «среднее значение больше 25»

Имея α = 5%, поскольку распределение симметрично, мы будем иметь два критических значения z-показателей: Zα/2 = 0,025, значение которого из таблицы z равно +1,96, и -Zα/2 = 0,025, значение которого равно -1,96.

Поскольку z-показатель выходит за пределы допустимой области, мы можем отклонить нашу нулевую гипотезу о среднем значении генеральной совокупности, равном 25: у нас достаточно доказательств (со значимостью 5%), чтобы отклонить эту гипотезу.

Кредиты: - isixsigma, в направлении науки о данных