Предыстория:

Однажды мой начальник попросил меня проверить, есть ли в данных определенное количество событий, чтобы провести анализ эффективности. Мне было любопытно, как он пришел к числу, позже я знаю, что он, должно быть, сделал расчет размера выборки . Сегодня мы рассмотрим основы и приложения R для расчета размера выборки.

Пять компонентов размера выборки:

Размер выборки: N
Частота ошибок типа I: уровень α (2-сторонний 0,05)
Среднее значение при нулевом и альтернативном значениях: μ0 и μa
Дисперсия: σ²
Сила: 1-β

Мы можем использовать любые четыре из этих пяти факторов для расчета пятого.

Два метода расчета размера выборки:

  1. Проверка гипотез: конкретная нулевая и альтернативная гипотезы.
  2. Доверительный интервал: предполагаемый интерес

Метод проверки гипотез:

  1. Укажите нуль и альтернативную гипотезу.
  2. Укажите стандартное отклонение
  3. Определите мощность и альфа-уровень
     – мощность = 0,8, альфа = 0,05 для двустороннего теста.
  4. Сформулируйте тест
  5. Программа R/ SAS
1. H0: mean=80, Ha: mean1= 70
2. standard deviation =20, d=(80-70)/20
3. Power=0.8 , Alpha=0.05 for two-sided test
 
pwr.t.test(d =0.5 , sig.level =0.05, power =0.8 , type = "one.sample", alternative="two.sided")
#General formula:
pwr.t.test(n=, d = , sig.level =, power =, type = ("one.sample","two.sample", "piared"), alternative=("two.sided", "less", "great"))
One-sample t test power calculation 
              n = 33.36713
              d = 0.5
      sig.level = 0.05
          power = 0.8
    alternative = two.sided

Расширенный размер выборки:

  • Двухвыборочный Т-тест
  • Сравнение пропорций

pwr.t.test(d=0.7882 , sig.level =0.05, power =0.8 , type = "two.sample", alternative="two.sided")

Two-sample t test power calculation 
              n = 26.26343
              d = 0.7882
      sig.level = 0.05
          power = 0.8
    alternative = two.sided
NOTE: n is number in *each* group

Сводка вариантов размера выборки:

  1. Дисперсия σ² увеличивается, размер выборки N увеличивается
  2. Разница между группами увеличивается (μ1-μ2), объем выборки N уменьшается
  3. Частота ошибок типа I (α) увеличивается, размер выборки N уменьшается
  4. Степень (1-ß) увеличивает размер выборки, увеличивая N.

Спасибо 77 за то, что поделились материалами класса Havard Catalyst!

Счастливого обучения!