Основы анализа временных рядов

Изображение автора, использующего fbprophet

Анализ временных рядов — это проблема, о которой забывают большинство специалистов по продуктам и данным, хотя это одна из самых важных областей, если мы свяжем ее с реальным миром.

Когда я изучаю науку о данных, машинное обучение и искусственный интеллект, я наткнулся на множество видеороликов, в которых говорится, что вы можете несколько раз предсказать цену акций, используя нейронную сеть, модели машинного обучения или анализ временных рядов. Парень, который демонстрирует использование временных рядов анализ, который он использовал Facebook Prophet, который привлек мое внимание ко всей теме, которая была упущена во время моего исследования,

Итак, я глубоко погружаюсь в тему, чтобы больше понять предмет, чтобы найти подходящее применение в моей жизни, и вот что я понял,

1-Что такое анализ временных рядов/модель.

Мы можем сказать, что любые данные, связанные с единицей времени, вы можете применить за несколько шагов и разбить их на компоненты, и на основе результатов этих компонентов это позволяет вам прогнозировать краткосрочные колебания цены или количества, или любая вещь была связана с единица времени.

Для простоты и ясности мы будем использовать набор данных о ценах на золото с 2001 по 2021 год.

Цена за унцию золота по автору

2- Что такое компоненты временного ряда

Любой временной график, с которым вы можете столкнуться, будь то график цены акций, количество жалоб, количество посещений врача или даже цена помидора, вы можете заметить несколько моделей на графике.

А) основной паттерн, который вы можете заметить, — это общий угол и направление цены с использованием множества единиц времени, которые мы называем трендом. Вы можете увидеть его на нашем графике ниже. :

График цен за унции золота с пунктирной линией тренда с учетом всей продолжительности

Цена за унцию золота с учетом меньшей единицы времени

На приведенной выше диаграмме вы можете видеть пунктирную линию, которая относится к линии тренда, которая также известна как линейная регрессия в науке о данных.

Линейная регрессия означает: подбор линии в оптимальном месте, которая уменьшает результат суммы средней ошибки, или вы можете представить, что это средняя (средняя) линия точек данных «Простое изображение, очень простое»

Б) Как мы видим на графике, вокруг линии тренда есть несколько подъемов и спадов, что отражает то, что компонент является не просто трендом, а на самом деле им не является.

Сколько раз вы сталкивались с информацией о том, что цена на какую-либо вещь максимально повышается в выходные, а в будние дни ее цена падает?

движение выше относится к Сезонности,

Сезонность относится к любой последовательности или повторяющемуся шаблону во времени, есть сезонность будних дней, сезонность месяца, сезонность отпуска «Ежегодно» и сезонность кризисов, «которую нельзя предсказать до сегодняшнего дня».

Итак, давайте получим сезонность на приведенном выше ценовом графике,

Годовая сезонность по писателю

На приведенном выше графике вы заметите, что цена на золото в феврале является самой высокой, а в январе, июле и августе наблюдается тенденция к росту, что относится к реальным мировым ценам.

Еженедельная сезонность по писателю

Заключительный компонент — это нерегулярность, которые относятся к тому факту, что, несмотря на то, сколько данных вы собираете, очищаете, структурируете, вы все равно не можете предсказать, как поведет себя реальный мир, есть много факторов, события влияют на действия в реальном мире,

Огромные события, которые могут поднять цены до луны, другое событие, такое как пандемия коронавируса, которая затрагивает весь мир и приводит к самому низкому падению цен на все деловые акции, люди психологические, которые также влияют на движение, рыночная депрессия также имеет большое влияние. , где нам нужно будет удалить, чтобы предотвратить его влияние на прогнозы.

Таким образом, прогнозирование временных рядов будет предполагать, что нет крупных событий, которые могут повлиять на тенденцию, сезонность, и учитывать неравномерность, поскольку шум данных не может следовать определенным закономерностям.

Заключение:

Диаграмма временного ряда состоит из трех основных компонентов:

Тенденция

Б) Сезонность

В) Неравномерность

и значение в любое время, пока не может быть разбито по следующей формуле

Vt= V(t-1) X Tt X St X It

Где :

Vt = значение в данную единицу времени

Vt-1 = значение в предыдущую единицу времени

Tt = коэффициент тренда

St = фактор сезонности.

It = неравномерность данных

В соответствии с приведенной выше формулой мы можем предсказать следующее приходящее значение, учитывая, что не происходит никакой неравномерности, где мы можем использовать следующую формулу:

Vt= V(t-1) X Tt X St

Далее я напишу статью, которая шаг за шагом проведет вас по приведенному выше примеру, а также мы предскажем цену за год на основе имеющихся у нас данных.

Прогноз цен на золото в унциях с использованием fbprophet

Если вам нравится читать мой контент, рассмотрите возможность подписки на мой канал.

Кроме того, если вы не являетесь участником Medium и хотите получить неограниченный доступ к платформе, рассмотрите возможность использования моей реферальной ссылки для регистрации. Это 5 долларов в месяц, и вы получаете неограниченный доступ к моим статьям и многим другим. Спасибо.