Доверительные интервалы, проверка гипотез, статистика испытаний

Доверительные интервалы: дает диапазон оценок, в который может попасть значение генеральной совокупности с определенной степенью достоверности. Чаще всего используется для измерения неопределенности выборочной переменной. Например, доверительный интервал 95 % показывает, что значение в 95 раз больше 100, вероятно, содержит истинное значение генеральной совокупности, или мы с уверенностью 95 % попадаем в диапазон оценки.

Погрешность: это дает нам ошибку случайной выборки. Чтобы упростить определение, оно сообщает нам, в каком процентном отношении наша выборка отличается от реального значения генеральной совокупности. Наиболее распространенным значением является предел погрешности 5% с доверительным интервалом 95%, что означает, что статистика будет лежать в пределах 5% выше или ниже указанного значения с доверительной вероятностью 95%.

Проверка гипотезы: Статистический метод проверки того, действительно ли предположение верно, что противоречит исходной идее или предположению. С точки зрения статистики, он использует данные из выборки, чтобы сделать выводы о населении.
Существует два типа тестов: параметрический и непараметрический тест. В зависимости от того, считаем ли мы наши данные нормальными, мы используем тесты. Параметрические тесты: сюда входят z-тест, t-тест, f-тест, ANOVA
Непараметрические тесты: этот список включает хи-квадрат, U-тест, H-тест.

t-критерий: основан на T-распределении Стьюдента. Проверка значимости разницы средних значений при небольшом размере выборки (n‹ 30) и неизвестном стандартном отклонении популяции

когда мы сравниваем среднее значение выборки со средним значением совокупности, мы используем один выборочный t-критерий, в то время как мы используем два выборочных t-теста для сравнения двух выборочных средних.

Z-тест: Z-тест используется при проверке значимости различных средних, когда выборка большая (n > 30) и когда мы знаем стандартное отклонение населения.

при сравнении среднего значения выборки со средним значением совокупности мы используем одну выборку, тогда как мы используем тест z для двух выборок при сравнении двух средних значений выборки.

F-тест: F-тест используется для проверки равенства дисперсий двух популяций. Он широко используется для сравнения статистических моделей, которые лучше всего подходят для набора данных с использованием метода наименьших квадратов. F-статистика представляет собой отношение двух дисперсий.
Может использоваться для сравнения двух средних значений генеральной совокупности при условии, что они имеют одинаковое стандартное отклонение.

ANOVA: Дисперсионный анализ является расширением t-теста и z-теста. Он использует F-тест для статистической проверки равенства средних и относительной дисперсии путем анализа уровней выборочной дисперсии внутри групп (две или более) и между ними.
Тест ANOVA можно использовать для определения влияния независимых переменных на зависимую переменную в задачах регрессии. один способ используется для анализа одной зависимой переменной с использованием независимой переменной, а два способа для анализа влияния двух независимых переменных на зависимую переменную.

Хи-квадрат: это непараметрический тест, поэтому его можно использовать, когда параметрические предположения не могут быть выполнены. В общем, он измеряет различия между тем, что наблюдается, и тем, что ожидается в соответствии с предполагаемой гипотезой, и может ли причина отклонения быть объяснена случайностью.
Используется в задачах машинного обучения для проверки качества соответствия и как проверка независимости двух переменных.
Значение хи-квадрат равно нулю, если разница в наблюдаемой и ожидаемой частотах равна нулю и чем больше разница, тем больше значение хи-квадрат

Его преимущество по сравнению с t-критерием можно объяснить следующим:
- его надежность по отношению к распределению данных
- его легко вычислить
- подробная информация из теста

U-критерий: также называемый U-критерием Манна-Уитни или критерием суммы рангов Уилкоксона, является непараметрическим критерием. Это непараметрический аналог Т-критерия, и его можно использовать для оценки значимости, когда размер выборки невелик и население не распределено нормально. Используется для проверки того, взяты ли две выборки из совокупности. В качестве альтернативы используется для сравнения каждого наблюдения выборки с другими, утверждая, что нулевая гипотеза для теста: вероятность полупериода случайного наблюдения из первой выборки больше, чем наблюдение из второй выборки.

U1 + U2 = n1*n2

H-тест: это непараметрический тест. Также называемый H-критерием Крускала-Уоллиса или однофакторным дисперсионным анализом рангов, это ранговый критерий, который можно использовать для определения наличия статистически значимых различий между двумя или более группами независимой переменной в непрерывной или порядковой зависимой переменной. . Он используется, когда предположения однофакторного дисперсионного анализа не выполняются или когда данные не распределены нормально.

Вот и все на сегодня!! мы продолжим рассматривать концепции статистики в следующих постах. Не стесняйтесь, дайте мне знать, если вам нужно, чтобы я добавил дополнительные темы или углубился в какую-либо конкретную тему.

предыдущие похожие посты: