Методы анализа временных рядов можно разделить на параметрические и непараметрические. Параметрические модели значительно отличаются от непараметрических моделей из-за некоторых допущений, требуемых параметрическими моделями в отношении структуры временной и пространственной ковариации и предельных распределений вероятностей данных временных рядов, тогда как непараметрические модели поддерживают только эмпирическую структуру наблюдаемых временных рядов. данные.

Параметрические методы. Параметрические методы предполагают, что базовый стохастический стационарный процесс имеет определенное структурное образование, которое может быть описано с использованием небольшого числа параметров. Чтобы параметрический метод предсказывал будущие данные, достаточно знать только параметры.

Теория, лежащая в основе параметрических моделей временных рядов, богата, и их приложения можно найти во многих областях, включая дополнительную область исследований, которая включает финансовые и экологические данные.

  • Основная задача параметрических подходов состоит в оценке параметров модели временного ряда, описывающей стохастический процесс.
  • При использовании параметрических моделей требуются только параметры из исторических данных модели для прогнозирования будущих значений временных рядов.
  • Для анализа данных временных рядов параметрическая модель является хорошим выбором, поскольку ее легко использовать из-за прозрачности и меньшей вычислительной мощности.
  • При параметрическом моделировании мы оцениваем параметры распределения вероятностей, предполагаемые для данных временных рядов.
  • Некоторыми примерами параметрических методов являются ARMA, ARIMA и экспоненциальное сглаживание.

Преимущества

  • Эти методы лучше всего подходят для простых задач
  • Быстро запоминает данные
  • Параметрические методы проще, их легче понять и интерпретировать результаты.
  • Требуется меньшее количество данных
  • Вычислительно недорогой
  • Надежность прогнозов

Ограничения

  • Невозможность зафиксировать тонкие закономерности в данных временных рядов

Непараметрические методы: непараметрические методы явно оценивают ковариацию стохастического процесса, не предполагая, что стационарный процесс может иметь какую-либо определенную структуру. Для непараметрического метода прогнозирование будущих данных основано не только на параметрах, но и на текущем состоянии наблюдаемых данных.

  • Требовать текущее состояние данных с рядом параметров для прогнозирования будущих значений данных временных рядов.
  • Непараметрические модели вычислительно медленнее, чем параметрические модели, но делают меньше предположений о данных временных рядов.
  • Непараметрические методы склонны к дополнительной точности, поскольку они пытаются найти наилучшее соответствие точкам данных.
  • Некоторыми примерами непараметрических методов являются нейронные сети, опорная векторная регрессия и LSTM.

Преимущества

  • Меньшее предположение о данных временных рядов
  • Эти методы могут привести к созданию высокопроизводительных моделей.
  • Еще более точное предсказание будущих данных может быть достигнуто, если будет предоставлено больше данных.

Ограничения

  • Эти методы вычислительно медленнее
  • Требует много дополнительных данных
  • Вычислительно затратный с точки зрения ресурсов

Алгоритм NPTS

Непараметрический временной ряд (NPTS) — это алгоритм, работающий непараметрическим способом и поддерживающий вероятностное прогнозирование.

NPTS — это локальная модель, что означает, что она изучает компоненты временных рядов каждого временного ряда отдельно и генерирует прогнозы для каждого временного ряда отдельно. Нет ограничений на длину временных рядов для моделирования.

Как работает NPTS??

  • NPTS использует индекс с фиксированным временем, где предыдущий индекс (T — 1) или прошлый сезон (T — тау) является прогнозом для временного шага T. Алгоритм случайным образом выбирает временной индекс (t) в наборе {0, …, T — 1} для генерации выборки для текущего временного шага T.
  • Проще говоря, он предсказывает будущее распределение значений данного временного ряда путем выборки из прошлых наблюдений. Прогнозы ограничены наблюдаемыми значениями.
  • Это эффективно для прерывистых (разреженных) временных рядов с большим количеством нулей. Например, набор данных для отдельных предметов/продуктов магазина содержит много нулей и неравномерен. Прогнозирование спроса на эти предметы снова является огромной проблемой.

Варианты NPTS:

Библиотека Amazon Forecast NPTS и GluonTS предлагает следующие варианты: NPTS, сезонный NPTS, климатологический прогнозист и сезонный климатологический прогнозист.

  1. НПТС
  • В этом варианте с помощью выборки всех наблюдений генерируются прогнозы для обучающего диапазона временных рядов. Этот вариант присваивает вес каждому из прошлых наблюдений в зависимости от того, насколько оно далеко от текущего временного шага, когда требуется прогноз.
  • Он использует концепцию, называемую экспоненциальным распадом в соответствии с расстоянием прошлых наблюдений. Таким образом, недавние наблюдения отбираются с гораздо большей вероятностью и весомостью, чем наблюдения из далекого прошлого, поскольку предполагается, что недавнее прошлое является более показательным и способным уловить тенденцию для будущего, чем отдаленное прошлое. Степень затухания можно контролировать с помощью параметра exp_kernel_weights.

  • Чтобы использовать NPTS, установите для гиперпараметра kernel_type значение exponential, а для гиперпараметра use_seasonal_model — значение False.

2. Сезонный NPTS

  • Сезонный NPTS очень похож на NPTS, за исключением того, что вместо выборки из всех наблюдений он использует только наблюдения за прошлые сезоны.
  • Сезон будет определяться на основе детализации временного ряда. Например, для минутных данных, чтобы предсказать минуту t, этот вариант выборки из наблюдений, соответствующих минуте t в предыдущие дни.
  • Подобно NPTS, наблюдения в минуту t в предыдущие дни имеют больший вес, чем наблюдения в минуту t в предыдущие дни.
  • Сезонные функции : временные характеристики для различных частот показаны ниже.
    MINUTE_OF_HOUR — для поминутной частоты
    HOUR_OF_DAY — для почасовой частоты
    DAY_OF_WEEK — для ежедневной частоты
    DAY_OF_MONTH — для еженедельной частоты
    MONTH_OF_YEAR — для месячной частоты
  • Модель NPTS включает эти производные функции, поэтому пользователям не нужно их предоставлять.
  • Чтобы использовать Seasonal NPTS, установите для гиперпараметра kernel_type значение exponential, а для гиперпараметра use_seasonal_model — значение True.

3. Климатолог

  • Вариант климатологического прогнозиста отбирает все прошлые наблюдения с одинаковой вероятностью, что означает, что наблюдениям не будет присвоен вес.
  • Распределение выборки для однородного ядра может быть сезонным или нет. Сезонная версия определяется следующим образом.

  • Несезонная версия определяется как постоянная карта qT(t)=1.0
  • Чтобы использовать климатологический прогнозист, установите для гиперпараметра kernel_type значение uniform, а для гиперпараметра use_seasonal_model — значение False.

4. Сезонный климатолог

  • Подобно сезонному NPTS, сезонный климатолог выбирает наблюдения прошлых сезонов, а затем выбирает их с одинаковой вероятностью.
  • Чтобы использовать сезонный климатологический прогнозист, установите для гиперпараметра kernel_type значение uniform, а для use_seasonal_model — значение True.

Однако исследователь выбирает параметрические модели вместо моделей ML для задач прогнозирования временных рядов по следующим причинам.

  • Модели ML требуют больших вычислительных ресурсов, чем параметрические методы и методы прогнозирования.
  • Из-за случайности данных временных рядов методы ML могут отличать шаблоны от шума в данных, поэтому можно избежать проблемы переобучения. Однако параметрические методы могут напрямую контролировать переоснащение, применяя некоторые информационные критерии, такие как AIC и BIC.
  • Было трудно понять, как генерируются прогнозы с использованием моделей ML. Получение цифр из черного ящика неприемлемо для практиков, которым необходимо знать, как возникают прогнозы и как они могут влиять.
  • Методы машинного обучения требуют специальных знаний для его реализации по сравнению со статистическими методами прогнозирования временных рядов.

Заключение

Прогнозирование временного ряда было очень сложной задачей. На протяжении многих лет исследователи прилагали значительные усилия для разработки сложных методов, структур и мер точности или погрешности для прогнозирования временных рядов. Одним из таких методов являются непараметрические модели, которые приобрели популярность в области прогнозирования временных рядов благодаря своей способности улавливать тонкие закономерности в данных временных рядов.

Модель NPTS способна более точно отражать тренд и сезонность. Для данного набора данных он может не работать с параметрами по умолчанию, в этом случае требуется битовая настройка параметров. Для данных дневного уровня много времени на предсказания не потребуется, это довольно быстро. Вы можете получить прогнозы для сотен временных рядов за несколько секунд или минут. Для набора данных с более низкой степенью детализации это может занять некоторое время, поскольку внутри будет выполняться огромное количество математических операций.

По любым вопросам вы можете обращаться ко мне через LinkedIn и Gmail

Продолжай учиться! Счастливого обучения!!!

Ссылки