Логистическая регрессия с категориально и непрерывными независимыми переменными. Кривая ROC и матрица путаницы

Я пытаюсь выполнить логистическую регрессию, используя приведенный ниже синтаксис:

logregmodel <- glm(Y ~., data = quant, family = binomial() )

У меня есть 15 категориальных переменных и 30 непрерывных переменных. Используя приведенный выше синтаксис, я не могу определить, что такое непрерывные и категориальные переменные. Ввод их вручную займет много времени. Также я хочу добавить кривую ROC и матрицу путаницы. к выходу.Пожалуйста, помогите.


r glm
person user3045652    schedule 07.01.2014    source источник
comment
Вы можете использовать, например. sapply(quant, is.numeric) или sapply(quant, class) для проверки типов переменных и quantsub <- subset(quant, ...) для создания подмножества переменных, которые вы хотите встроить в свою первую модель.   -  person lukeA    schedule 07.01.2014


Ответы (1)


Если в quant категориальные переменные не являются числовыми, glm будет правильно обрабатывать их как категориальные переменные.

Чтобы получить матрицу путаницы, используйте функцию predict:

# This will give you probabilities.
fitted <- predict(logregmodel, quant, type="response")

# Use a cut point to divide into classes
cutpoint <- 0.5
estimated.class <- ifelse(fitted > cutpoint, 'Class 1', 'Class 2')

# Calculate the confusion matrix
table(estimated.class, actual.class)

Вы можете использовать пакет ROCR, чтобы получить кривую ROC. Вот хорошее объяснение. Вам придется немного прокрутить вниз для части кривой ROC, но в целом это важно.

Пакет ROCR (в частности, функция prediction) также может использоваться для получения матрицы путаницы.

Я хотел бы только отметить, что кривая ROC и показатели производительности модели, такие как чувствительность или специфичность, будут смещены, если они рассчитаны на основе прогнозируемых ответов, полученных из того же набора данных, который использовался для подбора модели.

person Christopher Louden    schedule 07.01.2014
comment
Спасибо Кристоферу и Люку за ваше руководство. Очень информативно и полезно. - person user3045652; 08.01.2014