среднее значение и медиана остатков линейной модели

Я только начал изучать R и мне нужна помощь в поиске среднего и медианы остатков для моих данных. Я рассчитал lm и в сводке получил следующие остатки:

min       1Q        median  3Q      Max
-111.86   -34.90     -7.6   33.46   182.58

Вопрос: значит, медиана остатков равна -7,6, но какое у меня среднее значение? Или есть расчет для нахождения среднего и медианы остатков? Я собирался сделать mean(resid(trees.lm) или его нужно ввести как mean(trees.lm$resid)

Пожалуйста, уточните, потому что все мои одноклассники получают разные ответы на один и тот же набор данных.


person Community    schedule 17.09.2012    source источник


Ответы (1)


Вот ответ на один конкретный вопрос:

mean(resid(trees.lm))

Вы не должны углубляться в подогнанные объекты модели, подобные этому, и удалять произвольные компоненты. Делая это на чем-то более сложном, таком как GLM, вы откусите руку, когда поймете, что только что извлекли рабочие остатки с помощью:

glm.mod.obj$residuals

которые вряд ли вам пригодятся.

Даже для простых вещей, таких как объекты lm(), использование resid() или доступ к $residuals может различаться в зависимости от того, как была подобрана модель (например, какова была настройка для аргумента na.action?).

Кроме того, линейная модель предполагает, что остатки i.i.d. Гауссовы (или нормальные) случайные величины со средним значением 0 и дисперсией $\hat{\sigma}^2}$, поэтому среднее значение должно быть очень близко к 0 (т.е. очень, очень, очень близко к 0, но не совсем потому, что это компьютер). и арифметика с плавающей запятой в игре).

person Gavin Simpson    schedule 17.09.2012
comment
Независимо от того, как модель подходит, среднее значение остатков будет близко к нулю. Это никогда не должно удивлять в OLS. - person assumednormal; 17.09.2012
comment
Ой, когда я это писал, я имел в виду что-то другое, и вы совершенно правы. Исправляю свою глупость. - person Gavin Simpson; 17.09.2012
comment
В МНК сумма остатков точно равна нулю. Это свойство минимизации квадратов остатков. - person Michael R. Chernick; 17.09.2012
comment
@MichaelChernick, вы правы, за исключением того, что R обычно сообщает среднее значение 1e-14 или что-то подобное. Вот почему я оставил свой комментарий как близкий к нулю, а не точно к нулю. - person assumednormal; 17.09.2012
comment
Действительно @Max и, следовательно, почему я оставил бит, близкий к нулю, когда вносил свои изменения. Математически это должно быть 0, но компьютер сообщит об этом как о чем-то почти нулевом, что может сбить людей с толку, если они этого не знают. - person Gavin Simpson; 17.09.2012