Набор данных Блочная диаграмма
Выше приведены данные и некоторый обзор того, как это выглядит. Я хочу использовать t-тест, чтобы определить, отличается ли средняя ширина между двумя выборками из одной и той же популяции (две хвостатые). В частности, меня интересует, больше ли средняя ширина группы b, чем средняя ширина группы a (1 хвост).
Я знаю, что при использовании t-критерия и проверки гипотез в целом вы должны определить нулевую гипотезу (и то, что вы ожидаете увидеть) до проведения тестов или изучения данных. Здесь выборка примерно нормальная, и я не буду предполагать равную дисперсию
Некоторые вопросы, которые у меня все еще есть:
I Проведите двусторонний тест и убедитесь, что между двумя средними значениями имеется статистически значимая разница. Отсюда, могу ли я запустить односторонний тест в обоих направлениях, чтобы проверить, имеет ли группа b большую среднюю ширину? В чем проблема с выполнением двухстороннего теста перед односторонним? На мой взгляд, это имеет смысл... Проверьте разницу, затем проверьте направление разницы.
Если бы размер моей выборки был намного больше для каждой группы, скажем, n = 500 для каждой, нужно ли было бы мне проверять нормальность данных? Или числа в образце будет достаточно, чтобы продолжить работу с ненормальными данными?
Интерпретация уровня достоверности: если у нас альфа = 0,05, а наше p-значение меньше этого, можем ли мы сказать, что мы на 95% уверены, что разница в средних значениях различна?