Распутать проверку гипотез с подробным пошаговым руководством

Введение:

что такое проверка гипотез?

  • Статистический тест, который дает свидетельство принятия или отклонения нулевой гипотезы с выборкой данных из условия, которое истинно для всей совокупности.
  • Если нам нужно показать, что два распределения различны, мы доказываем от противного, предполагая, что оба распределения одинаковы, что является нашей нулевой гипотезой.

Пример:

Рассмотрим рост населения C1, C2 студентов из двух классов. Проблема состоит в том, чтобы доказать, что средние высоты C1 и C2 одинаковы.

Действия по проверке гипотез:

а) Выберите статистику теста:

  • Статистика теста = разница в средних значениях генеральной совокупности.

Наблюдаемая разница в средних (uc1-uc2) = 30

  • Статистика теста должна быть рассчитана с учетом данных.

б) Примите нулевую гипотезу (H0) и альтернативную гипотезу (H1)

  • Нулевая гипотеза (H0) = Средние значения C1 и C2 не различаются.
  • Альтернативная гипотеза (H1) = T вот разница в средних значениях C1 и C2.

c) Установите уровень значимости (альфа)

  • Установите альфа-канал в соответствии с бизнес-требованиями, в данном случае скажем 0,15 (15%).

г) Рассчитайте P-значение с помощью теста повторной выборки и перестановки:

«p -значение - это вероятность получения результата статистики теста из выборки данных, при условии, что нулевая гипотеза верна».

  • P-Value = P (Предполагается, что возникновение наблюдения | H0 верно)
  • проверка повторной выборки и перестановки: поскольку нулевая гипотеза верна, предположение здесь, что C1 и C2 одинаковы.

C = C1 объединение C2

Образцы C1 'и C2' из C находят разницу в средних значениях из этих образцов U ’

  • повторите этот эксперимент 1000 раз, сохраните {U’1, U’2, U’3 '……… .U’1000}
  • Если в 900 раз среднее значение выборочных данных
  • p-значение == 0,10

д) отклонить или принять нулевую гипотезу.

  • p-значение (0,1) меньше 0,15 (значение значимости) Таким образом, мы получили доказательства для отклонения нулевой гипотезы, есть разница между средним ростом учеников двух аудиторий.

Ссылка:

Www.appliedaicourse.com

Проверить:



Лучшие и худшие примеры моделей машинного обучения - Часть 1
Что использовать? medium.com