Двухвостый и однохвостый T-тест в R

Гистограмма

Набор данных Блочная диаграмма

Выше приведены данные и некоторый обзор того, как это выглядит. Я хочу использовать t-тест, чтобы определить, отличается ли средняя ширина между двумя выборками из одной и той же популяции (две хвостатые). В частности, меня интересует, больше ли средняя ширина группы b, чем средняя ширина группы a (1 хвост).

Я знаю, что при использовании t-критерия и проверки гипотез в целом вы должны определить нулевую гипотезу (и то, что вы ожидаете увидеть) до проведения тестов или изучения данных. Здесь выборка примерно нормальная, и я не буду предполагать равную дисперсию

Некоторые вопросы, которые у меня все еще есть:

  1. I Проведите двусторонний тест и убедитесь, что между двумя средними значениями имеется статистически значимая разница. Отсюда, могу ли я запустить односторонний тест в обоих направлениях, чтобы проверить, имеет ли группа b большую среднюю ширину? В чем проблема с выполнением двухстороннего теста перед односторонним? На мой взгляд, это имеет смысл... Проверьте разницу, затем проверьте направление разницы.

  2. Если бы размер моей выборки был намного больше для каждой группы, скажем, n = 500 для каждой, нужно ли было бы мне проверять нормальность данных? Или числа в образце будет достаточно, чтобы продолжить работу с ненормальными данными?

  3. Интерпретация уровня достоверности: если у нас альфа = 0,05, а наше p-значение меньше этого, можем ли мы сказать, что мы на 95% уверены, что разница в средних значениях различна?


person Boss Boyd    schedule 23.06.2021    source источник


Ответы (1)


  1. Я бы пошел только на один тест, обычно используется двусторонний тест. Чтобы провести односторонний тест, вы должны были обосновать его ДО просмотра ваших данных. Например, если я бросаю мяч с двух разных высот, я полагаю, что время падения мяча с меньшей высоты будет меньше, прежде чем он упадет на землю. Так что я мог оправдать использование одностороннего теста.
  2. Обычно люди применяют t-критерий, даже если распределения не являются нормальными. Однако вы можете использовать непараметрические тесты, такие как сумма рангов. Или вы можете использовать ANOVA, который довольно устойчив к отклонениям от нормальности.
  3. Можно сказать, что вы на 100 % уверены в том, что не допустили ошибки первого рода, отвергнув нулевую гипотезу. Или, если вы проведете этот эксперимент 100 раз, вы неправильно отклоните р-значение нулевой гипотезы * 100 раз. Для меня это обычно самый простой способ обдумать интерпретацию p-значения.
person Baraliuh    schedule 23.06.2021