Прогнозирование временных рядов по цене акций — Kaggle

Введение

В этом проекте цель состоит в том, чтобы спрогнозировать цену акций S&P500 на следующие три месяца. Индекс S&P 500 (Standard and Poor’s 500) представляет собой индекс, состоящий из 500 акций из различных секторов экономики США, и является индикатором акций США. Другими такими индексами являются Dow 30, NIFTY 50, Nikkei 225 и т. д.

Для нашего текущего варианта использования мы будем использовать набор данных акций из истории индекса S&P 500 в базах данных Yahoo Finance. мы исследовали использование таких моделей для прогнозирования запасов и использования прогнозов для прогнозирования динамики запасов. В частности, мы использовали модели ARIMA(X), ARIMA и ESM для прогнозирования динамики акций S&P 500.

S&P 500

S&P 500, сокращение от Standard and Poor’s 500, в США — индекс фондового рынка, который отслеживает 500 публичных отечественных компаний. Многие инвесторы считают его лучшим общим показателем эффективности американского фондового рынка.

Информация о данных

Функции

  • Дата – дата торговли
  • Открытие — цена открытия на эту дату.
  • Close — цена закрытия на эту дату.
  • Максимальная – самая высокая цена за эту дату.
  • Низкая — самая низкая цена на эту дату.
  • Объем — общий объем торговой активности.
  • Adj.Close — скорректированные значения учитывают корпоративные действия, такие как дивиденды, дробление акций и выпуск новых акций.

Параметры

Ряды: 1766; Колонка : 7

Период

с 16 января по 20 октября

Образец данных

Цена акций с объемом (январь 2016 г. — октябрь 2020 г.)

Исследовательский анализ данных

  • Одномерный анализ — высокий
  • Одномерный анализ — низкий
  • Одномерный анализ — открытый
  • Одномерный анализ — смежное закрытие
  • Одномерный анализ — объем
  • Тест автокорреляции и белого шума
  • Анализ дистрибуции — Закрыть
  • Факторный анализ (корреляция и общая дисперсия)

Одномерный анализ — высокий

Одномерный анализ — низкий

Одномерный анализ — открытый

Одномерный анализ —Смежное закрытие

Одномерный анализ —Объем

Автокорреляция и белый шум — близко

  • Функция автокорреляции показывает постепенное уменьшение тренда, в то время как функция частичной автокорреляции отключается сразу после одного отставания.
  • Таким образом, графики показывают, что модель AR (1) подходит для временного ряда.
  • Вероятность белого шума составляет ~ 0, что подтверждает, что серия НЕ является белым шумом.

Анализ распространения – Закрыть

Факторный анализ

Фактор 1:высокий, низкий, открытый, закрытый, скорректированный закрытый

Фактор 2:объем

Фактор 1 и фактор 2 объясняют 83% и 17% дисперсии соответственно.

Разработка функций

Включенные функции

  1. VIX = индекс волатильности, используемый для измерения волатильности на рынке в этот день.
  2. High_Low = эта переменная представляет собой разницу между максимумом и минимумом за предыдущий день.
  3. VarianceLast7= Эта переменная дает дисперсию движения цены за последние 7 дней.
  4. Vol_Close = Эта переменная представляет собой соотношение объема и цены закрытия за предыдущий день.
  5. Ставка = реальная процентная ставка ФРС США.
  6. PER = отношение цены к доходу, как и в предыдущий день.
  7. LastMonthPER = отношение цены к доходу за последние 30 дней.

Исключенные функции

  1. Высокая = высокая переменная сильно коррелирует (>98%) с закрытием зависимой переменной.
  2. Низкий = низкий уровень переменной сильно коррелирует (>98%) с закрытием зависимой переменной.
  3. Открытие = Открытие переменной сильно коррелирует (>98%) с закрытием зависимой переменной.
  4. Adj.Close = Переменная Adj.Close сильно коррелирует (>98%) с закрытием зависимой переменной.

Корреляционный анализ

в сравнении с закрытием

  • Vol_Close:-38%
  • В прошлом месяце : -6%
  • Объем:7%
  • ДисперсияПоследняя7:7%
  • VIX : 15%
  • Высокий_низкий:18%
  • PER :18%
  • IntRate: 51%
  • WkAvgClose : 99%
  • Открыто: 100%
  • Высокий уровень:100 %
  • Низкий уровень: 100 %.
  • Корректировка закрытия: 100%

Матрица корреляции показывает, что закрытие зависимой переменной сильно положительно коррелирует со средней недельной ценой закрытия, максимумом, минимумом, корректировкой закрытия и отрицательно коррелирует с Volume_Close и коэффициентом PE за последний месяц. VIX, процентная ставка и коэффициент PE имеют очень небольшую корреляцию с Close.

Факторный анализ — после разработки признаков

Отклонение объясняется каждым фактором

  • Коэффициент 1:6,55
  • Коэффициент 2 :4,21
  • Коэффициент 3 :1,81
  • Коэффициент 4 :0,56
  • Коэффициент 5 :0,28.
  • Коэффициент 6 :0,24

Моделирование прогнозов

  • Период обучения: 5 лет (с 15 августа по 20 июля)
  • Период прогнозирования: 3 месяца (с 20 августа по 20 октября)

Тест против прогноза

Заключение

High, Low, Open, Close, Adj Close сильно коррелируют друг с другом. Восходящий тренд и отсутствие сезонности демонстрируются всеми переменными, кроме объема, который показывает плоскую тенденцию. Зимняя модель ARIMAX и Holts работает лучше для этого варианта использования. Volume_Close отрицательно коррелирует с Close. Процентная ставка оказывает нейтральное влияние на цену закрытия. Вы можете найти код в github.

Поставьте лайк и подпишитесь, если вам понравился контент!