Логистическая регрессия — команда cbind в glm

Я делаю логистическую регрессию в R. Может ли кто-нибудь пояснить, в чем разница между этими двумя строками?

1. glm(Response ~ Temperature, data=temp, 
                    family = binomial(link="logit"))
2. glm(cbind(Response, n - Response) ~ Temperature, 
                    data=temp, family =binomial, Ntrials=n)

Данные выглядят следующим образом: (Примечание: ответ двоичный. 0=Умереть 1=Не умереть)

Response  Temperature
0         24.61
1         39.61
1         39.50
0         22.71
0         21.61
1         39.70
1         36.73
1         33.32
0         21.73
1         49.61

r regression glm

Eddie 02.02.2012 источник

comment

Пол... первая строчка проста для понимания. :). Я попытался понять второй, потому что он использовался в некоторых примерах на R. И .. эти два генерируют разные результаты. :) - Eddie 02.02.2012

comment

@ Джеймс прав, я считаю. Если n равно 1, то в этом случае вы должны получить точно такой же ответ. Как правило, вы должны использовать вторую форму, когда у вас есть более одного испытания на одно наблюдение. Насколько я могу судить, аргумент Ntrials фальшивый/ненужный. - Ben Bolker 02.02.2012

comment

Большое спасибо, Бен. Не могли бы вы уточнить, что вы подразумеваете под более чем одним испытанием или наблюдением, пожалуйста? :)- - Eddie 02.02.2012

comment

Предположим, ваши данные сгруппированы так, что вы измеряли несколько человек (например, 10) при каждом значении температуры; тогда у вас может быть 7 из 10 выживших при температуре 22,71, поэтому ваша оценка будет основана на биномиальном результате 7 выживших с вероятностью p в N = 10 испытаниях. Обычно, когда люди говорят о логистической регрессии, они имеют в виду разгруппированные данные (N=1), резервируя биномиальную регрессию для сгруппированного случая, но эти термины несколько взаимозаменяемы... - Ben Bolker 02.02.2012

Ответы (1)

arrow_upward
17
arrow_downward

При выполнении биномиального или квазибиномиального glm вы либо предоставляете вероятность успеха, матрицу из двух столбцов, в столбцах которой указано количество успехов и неудач, либо фактор, где первый уровень обозначает неудачу, а остальные успехи в левой части таблицы. уравнение. См. подробности в ?glm.

James 02.02.2012

comment

Обратите внимание, что при использовании частотной формы биномиального glm вы должны указать количество наблюдений за испытание в аргументе weights. Это будет выглядеть так: glm(events/n ~ x, data=*, weights=n, ...) - Hong Ooi; 02.02.2012

Логистическая регрессия — команда cbind в glm

Ответы (1)

Вопросы по теме