Логистическая регрессия — команда cbind в glm

Я делаю логистическую регрессию в R. Может ли кто-нибудь пояснить, в чем разница между этими двумя строками?

1. glm(Response ~ Temperature, data=temp, 
                    family = binomial(link="logit"))
2. glm(cbind(Response, n - Response) ~ Temperature, 
                    data=temp, family =binomial, Ntrials=n)

Данные выглядят следующим образом: (Примечание: ответ двоичный. 0=Умереть 1=Не умереть)

Response  Temperature
0         24.61
1         39.61
1         39.50
0         22.71
0         21.61
1         39.70
1         36.73
1         33.32
0         21.73
1         49.61

person Eddie    schedule 02.02.2012    source источник
comment
Пол... первая строчка проста для понимания. :). Я попытался понять второй, потому что он использовался в некоторых примерах на R. И .. эти два генерируют разные результаты. :)   -  person Eddie    schedule 02.02.2012
comment
@ Джеймс прав, я считаю. Если n равно 1, то в этом случае вы должны получить точно такой же ответ. Как правило, вы должны использовать вторую форму, когда у вас есть более одного испытания на одно наблюдение. Насколько я могу судить, аргумент Ntrials фальшивый/ненужный.   -  person Ben Bolker    schedule 02.02.2012
comment
Большое спасибо, Бен. Не могли бы вы уточнить, что вы подразумеваете под более чем одним испытанием или наблюдением, пожалуйста? :)-   -  person Eddie    schedule 02.02.2012
comment
Предположим, ваши данные сгруппированы так, что вы измеряли несколько человек (например, 10) при каждом значении температуры; тогда у вас может быть 7 из 10 выживших при температуре 22,71, поэтому ваша оценка будет основана на биномиальном результате 7 выживших с вероятностью p в N = 10 испытаниях. Обычно, когда люди говорят о логистической регрессии, они имеют в виду разгруппированные данные (N=1), резервируя биномиальную регрессию для сгруппированного случая, но эти термины несколько взаимозаменяемы...   -  person Ben Bolker    schedule 02.02.2012


Ответы (1)


При выполнении биномиального или квазибиномиального glm вы либо предоставляете вероятность успеха, матрицу из двух столбцов, в столбцах которой указано количество успехов и неудач, либо фактор, где первый уровень обозначает неудачу, а остальные успехи в левой части таблицы. уравнение. См. подробности в ?glm.

person James    schedule 02.02.2012
comment
Обратите внимание, что при использовании частотной формы биномиального glm вы должны указать количество наблюдений за испытание в аргументе weights. Это будет выглядеть так: glm(events/n ~ x, data=*, weights=n, ...) - person Hong Ooi; 02.02.2012