У меня есть вопрос относительно p-значений. Я сравнивал различные линейные модели, чтобы определить, лучше ли одна модель другой, со следующей функцией в R.
anova(model1,model2)
К сожалению, иногда он не вычисляет F или p-значение. Вот пример сводки анова, которая не дает p-значения
Analysis of Variance Table
Model 1: Influence ~ SortedSums[, Combos2[1, A]] + SortedSums[, Combos2[2,A]]
Model 2: Influence ~ SortedSums[, B]
Res.Df RSS Df Sum of Sq F Pr(>F)
1 127 3090.9
2 128 2655.2 -1 435.74
Ради симметрии, вот также сводка анова, которая действительно дала p-значение.
Analysis of Variance Table
Model 1: Influence ~ SortedSums[, Combos2[1, A]] + SortedSums[, Combos2[2,A]]
Model 2: Influence ~ SortedSums[, B]
Res.Df RSS Df Sum of Sq F Pr(>F)
1 127 3090.9
2 128 3157.6 -1 -66.652 2.7386 0.1004
Вы знаете, почему это происходит?
anova
, (2) Подмножьте свои данные вне выражения модели; это просто сбивает с толку и беспорядочно, (3) Проверьте эту проблему (из?anova
): сравнение между двумя или более моделями будет действительным, только если они подходят к одному и тому же набору данных. Это может быть проблемой, если есть пропущенные значения и используется R по умолчанию na.action = na.omit. - person bdemarest   schedule 10.08.2013