В прошлой статье мы рассмотрели несколько важных свойств функции автоковариации, а в предыдущих статьях мы несколько раз использовали функции ggAcf и ggPacf для построения АКФ и ПАКФ соответственно. Но как они на самом деле оцениваются, и откуда мы знаем, что они оцениваются правильно (и, надеюсь, не слишком далеко от истины)? В этой короткой статье мы объясним именно это. Давайте начнем!

Оценка автоковариации

Предположим, что у вас есть временные ряды с наблюдаемыми значениями

Тогда у нас есть следующее:

Выборочное среднее

В этом, наверное, нет ничего удивительного. Интересно следующее:

Выборочная автоковариация

далее это означает, что

Почему это так? Сначала напомним, что ковариация между двумя векторами U и V определяется выражением

Когда дело доходит до типовой версии этих оценщиков, вы можете думать о замене оператора ожидания некоторым средним значением данных; так что в этом случае мы получим

если строчные буквы u и v представляют случайные (наблюдаемые) компоненты вектора. Однако для временных рядов и «u», и «v» берутся из одних и тех же данных, и, поскольку мы на самом деле хотим оценить автоковариацию при разных лагах, вместо этого мы хотим «сдвинуть Данные вокруг отставания, которое мы хотим оценить. Например, мы можем установить

оценить некоторое отставание h. Эта оценка на самом деле предвзята, но непротиворечива, и оказывается, что она работает лучше, чем другие несмещенные оценки.

Пример автокорреляции

Как и следовало ожидать, у нас есть

Кроме того, мы имеем, что эта оценка соответствует асимптотической нормальности, что означает, что она имеет тенденцию вести себя как нормальное распределение по мере увеличения выборки. Более формально,

Это будет очень полезно в следующем разделе, где мы будем изучать тесты на стационарность, поскольку некоторые из них основаны на предположениях о нормальности. Доказательство этого утверждения довольно сложно объяснить, поэтому я не буду его здесь описывать, но если вам интересно, оно использует Закон больших чисел и Теорему Слуцкого. показать, что

Верхний индекс d здесь означает, что левая оценка «сходится по распределению» к нормальной случайной величине.

В следующий раз

Вот и все для этой короткой статьи! В следующий раз мы изучим кучу полезных тестов для проверки стационарности различных рядов, используя как параметрические, так и непараметрические методы, а также иллюстрации в R. Оставайтесь с нами, и до следующего раза!



Последний раз

Свойства функции автоковариации



Главная страница



Следуй за мной в

  1. https://blog.jairparraml.com/
  2. https://www.linkedin.com/in/hair-parra-526ba19b/
  3. https://github.com/JairParra
  4. https://medium.com/@hair.parra