Я надеюсь создать формулу в R, которую я смогу использовать для расчета стандартной ошибки оценки процента населения для различных демографических факторов. В моей выборке 1045 человек. Мой фрейм данных называется NHIS1, и, например, я хотел бы вычислить стандартную ошибку для доли белого или латиноамериканского населения. Переменные, которые у меня есть для WHITE и HISP, являются двоичными с индикаторами 0 или 1. Я рассчитал процентное соотношение населения с помощью этого кода:
#sum(NHIS1$WHITE)=637,nrow(NHIS1)=1045, and sum(NHIS1$HISP)=408
(sum(NHIS1$WHITE)/nrow(NHIS1))*100,
(sum(NHIS1$HISP)/nrow(NHIS1))*100
Я думал, что моя формула может выглядеть примерно так, как показано ниже, но я не уверен, есть ли лучший способ настроить все это так, чтобы R мог ссылаться на эти пропорции населения выше без того, чтобы я вручную подключал его.
perc_SE=function(p){sqrt((p*(1–p))/1045)}
Спасибо!