Предыстория:
Однажды мой начальник попросил меня проверить, есть ли в данных определенное количество событий, чтобы провести анализ эффективности. Мне было любопытно, как он пришел к числу, позже я знаю, что он, должно быть, сделал расчет размера выборки . Сегодня мы рассмотрим основы и приложения R для расчета размера выборки.
Пять компонентов размера выборки:
Размер выборки: N
Частота ошибок типа I: уровень α (2-сторонний 0,05)
Среднее значение при нулевом и альтернативном значениях: μ0 и μa
Дисперсия: σ²
Сила: 1-β
Мы можем использовать любые четыре из этих пяти факторов для расчета пятого.
Два метода расчета размера выборки:
- Проверка гипотез: конкретная нулевая и альтернативная гипотезы.
- Доверительный интервал: предполагаемый интерес
Метод проверки гипотез:
- Укажите нуль и альтернативную гипотезу.
- Укажите стандартное отклонение
- Определите мощность и альфа-уровень
– мощность = 0,8, альфа = 0,05 для двустороннего теста. - Сформулируйте тест
- Программа R/ SAS
1. H0: mean=80, Ha: mean1= 70 2. standard deviation =20, d=(80-70)/20 3. Power=0.8 , Alpha=0.05 for two-sided test pwr.t.test(d =0.5 , sig.level =0.05, power =0.8 , type = "one.sample", alternative="two.sided") #General formula: pwr.t.test(n=, d = , sig.level =, power =, type = ("one.sample","two.sample", "piared"), alternative=("two.sided", "less", "great")) One-sample t test power calculation n = 33.36713 d = 0.5 sig.level = 0.05 power = 0.8 alternative = two.sided
Расширенный размер выборки:
- Двухвыборочный Т-тест
- Сравнение пропорций
pwr.t.test(d=0.7882 , sig.level =0.05, power =0.8 , type = "two.sample", alternative="two.sided")
Two-sample t test power calculation n = 26.26343 d = 0.7882 sig.level = 0.05 power = 0.8 alternative = two.sided NOTE: n is number in *each* group
Сводка вариантов размера выборки:
- Дисперсия σ² увеличивается, размер выборки N увеличивается
- Разница между группами увеличивается (μ1-μ2), объем выборки N уменьшается
- Частота ошибок типа I (α) увеличивается, размер выборки N уменьшается
- Степень (1-ß) увеличивает размер выборки, увеличивая N.
Спасибо 77 за то, что поделились материалами класса Havard Catalyst!
Счастливого обучения!