Если вы входите в мир анализа данных и машинного обучения, вы, возможно, уже понимали, насколько важен анализ временных рядов. Тем не менее, я постараюсь провести мягкое введение.

К концу этой статьи вы сможете:

  1. Определите, что такое временной ряд
  2. Определить данные временных рядов из данных, не относящихся к временным рядам
  3. Определите и опишите компоненты временных рядов.
  4. Упомяните некоторые модели, используемые для прогнозирования временных рядов.

Определение

Временные ряды - это последовательность точек данных, записанных во временном порядке, часто получаемых в последовательные точки с одинаковым шагом во времени.

Данные временного ряда могут быть получены ежегодно, ежемесячно, еженедельно, ежечасно или даже поминутно.

Анализ временных рядов включает методы анализа данных временных рядов с целью извлечения значимой статистики и других характеристик данных. Он отличается от временного ряда прогнозирования, который представляет собой использование модели для прогнозирования будущих значений на основе ранее наблюдаемых значений. В то время как анализ временных рядов - это в основном статистика, прогнозирование временных рядов входит в машинное обучение. Анализ временных рядов - это подготовительный этап к прогнозированию временных рядов.

Примеры данных временных рядов

  • Цены на акции, спрос на продажи, посещаемость сайта, дневные температуры, квартальные продажи

Временные ряды отличаются от регрессионного анализа тем, что они зависят от времени.

  1. Автокорреляция. Для регрессионного анализа необходимо, чтобы данные были незначительными или отсутствовали. Это происходит, когда наблюдения не независимы друг от друга. Например, в ценах акций текущая цена не зависит от предыдущей цены.
  2. Сезонность - характеристика, о которой мы поговорим ниже.

Анализ и прогнозирование временных рядов основаны на предположении, что прошлые закономерности в прогнозируемой переменной сохранятся без изменений в будущем.

Почему важен анализ временных рядов?

Потому что прогнозирование временных рядов важно! Бизнес-прогнозирование, понимание поведения в прошлом и планирование будущего, особенно для политиков, во многом полагаются на анализ временных рядов.

Данные временных рядов против данных, не относящихся к временным рядам

Если время - это то, что однозначно отличает одно наблюдение от другого, то весьма вероятно, что это набор данных временного ряда. Не все данные, собранные относительно времени, представляют собой временной ряд. Наблюдения должны быть зависимы от времени.

Компоненты временного ряда

  • Тренд: общее направление, в котором что-то развивается или меняется. Тренд может быть восходящим (восходящий) или нисходящим (нисходящий). Не всегда необходимо, чтобы увеличение или уменьшение происходило в одном и том же направлении в определенный период.

  • Сезонность: предсказуемая закономерность, которая повторяется или повторяется через определенные промежутки времени. Сезонность часто наблюдается в пределах года и менее.

Спрос на энергию в приведенном выше примере выше зимой и ниже летом, что совпадает с климатическими сезонами. Эта закономерность повторяется каждый год, указывая на сезонность во временных рядах.

Другой пример - розничные продажи, где в течение последнего квартала года в магазинах наблюдается высокий уровень продаж.

  • Циклы. Возникают, когда ряд следует восходящему и нисходящему шаблону, который не является сезонным. Циклические изменения носят периодический характер и повторяются, как деловой цикл, который состоит из четырех фаз (i) пик (ii) Рецессия (iii) Минимум / депрессия (iv) Расширение.

Сезонность отличается от циклов, поскольку сезонные циклы наблюдаются в течение календарного года, а циклические эффекты могут охватывать продолжительность короче или дольше календарного года.

  • Нерегулярные колебания. Эти колебания возникают по внезапным причинам и непредсказуемы. Например, рост цен на продукты питания из-за войны, наводнения, землетрясений, забастовки фермеров и т. Д.

Когда не следует использовать анализ временных рядов

  1. Когда значения постоянны - это означает, что они не зависят от времени, поэтому 1, данные не являются данными временного ряда, а 2 это бессмысленно, поскольку значения никогда не меняются.
  2. Значения в форме функции - например sin x, cos x и т. Д. Опять же, бессмысленно использовать анализ временных рядов при вычислении значений с помощью функции.

Методы моделирования и оценки

Хотя в этой статье речь идет не о прогнозировании, я упомяну несколько техник, которые используются для моделирования.

Моделирование: наивный подход, скользящее среднее, простое экспоненциальное сглаживание, модель линейного тренда Холта, интегрированное скользящее среднее с автоматической регрессией (ARIMA), SARIMAX и т. д.

Оценка: среднеквадратическая ошибка (MSE), среднеквадратическая ошибка (RMSE) и т. д.

Теперь, когда вы знаете, что такое временной ряд и каковы его характеристики, укрепите свои знания, проанализировав набор данных временного ряда. В этой статье рассматриваются различные типы данных временных рядов, которые вам понадобятся для практики вашего нового навыка! Вы также можете пройти этот бесплатный краткий курс для более глубокого изучения.