автор: ngngsonan

Памятка для анализа и понимания временных рядов

I. Что такое прогнозирование временных рядов?

Что такое прогнозирование временных рядов?

Компоненты временного ряда

Анализ временных рядов предоставляет набор методов для лучшего понимания набора данных. Пожалуй, наиболее полезным из них является разложение временного ряда на 4 составные части:

  1. Уровень. Базовое значение для ряда, если бы это была прямая линия.
  2. Тренд. Необязательное и часто линейное возрастающее или убывающее поведение ряда с течением времени.
  3. Сезонность. Необязательные повторяющиеся паттерны или циклы поведения с течением времени.
  4. Шум. Необязательная изменчивость наблюдений, которая не может быть объяснена моделью.

У всех временных рядов есть уровень, у большинства есть шум, а тренд и сезонность необязательны.

Как разработать модель прогнозирования временных рядов с помощью машинного обучения

II. Анализ

1. Как загружать и исследовать данные временных рядов в Python

2. Визуализация данных временных рядов с помощью Python

Мы рассмотрим 6 различных типов визуализации, которые вы можете использовать для своих собственных данных временных рядов. Они есть:

  1. Линейные сюжеты.
  2. Гистограммы и графики плотности.
  3. Коробчатые и вискерные графики.
  4. Тепловые карты.
  5. Лаг-графики или точечные графики.
  6. Графики автокорреляции.

3. Стационарный

Существует множество методов проверки того, является ли временной ряд (прямые наблюдения, остатки и т. д.) стационарным или нестационарным.

  • Просмотр графиков. Вы можете просмотреть график временных рядов своих данных и визуально проверить наличие явных тенденций или сезонности.
  • Сводная статистика. Вы можете просмотреть сводную статистику по своим данным за сезоны или случайные разделы и проверить наличие очевидных или существенных различий. (быстрая и грязная проверка среднего значения и дисперсии с преобразованием журнала giữa и оригиналом)
  • Статистические тесты: вы можете использовать статистические тесты, чтобы проверить, выполняются ли ожидания стационарности или были ли они нарушены. (Расширенный тест Дики-Фуллера)
  • Как определить и удалить сезонность из данных временных рядов с помощью Python

4. Тренд

Есть всякие тренды. Мы можем подумать о двух общих классах:

  • Детерминированные тенденции. Это тенденции, которые постоянно увеличиваются или уменьшаются.
  • Стохастические тренды. Это тренды, которые непоследовательно увеличиваются и уменьшаются.

Как правило, детерминированные тренды легче идентифицировать и удалять, но методы, обсуждаемые в этом руководстве, все же могут быть полезны для стохастических трендов. Мы можем думать о тенденциях с точки зрения сферы их наблюдения.

  • Глобальные тенденции. Это тенденции, которые относятся ко всему временному ряду.
  • Локальные тренды. Это тренды, которые применяются к частям или подпоследовательностям временного ряда.

Как правило, глобальные тенденции легче выявить и устранить.

5. Нежное введение в автокорреляцию и частичную автокорреляцию

6. Как нормализовать и стандартизировать данные временных рядов в Python