Прогнозирование временных рядов по цене акций — Kaggle
Введение
В этом проекте цель состоит в том, чтобы спрогнозировать цену акций S&P500 на следующие три месяца. Индекс S&P 500 (Standard and Poor’s 500) представляет собой индекс, состоящий из 500 акций из различных секторов экономики США, и является индикатором акций США. Другими такими индексами являются Dow 30, NIFTY 50, Nikkei 225 и т. д.
Для нашего текущего варианта использования мы будем использовать набор данных акций из истории индекса S&P 500 в базах данных Yahoo Finance. мы исследовали использование таких моделей для прогнозирования запасов и использования прогнозов для прогнозирования динамики запасов. В частности, мы использовали модели ARIMA(X), ARIMA и ESM для прогнозирования динамики акций S&P 500.
S&P 500
S&P 500, сокращение от Standard and Poor’s 500, в США — индекс фондового рынка, который отслеживает 500 публичных отечественных компаний. Многие инвесторы считают его лучшим общим показателем эффективности американского фондового рынка.
Информация о данных
Функции
- Дата – дата торговли
- Открытие — цена открытия на эту дату.
- Close — цена закрытия на эту дату.
- Максимальная – самая высокая цена за эту дату.
- Низкая — самая низкая цена на эту дату.
- Объем — общий объем торговой активности.
- Adj.Close — скорректированные значения учитывают корпоративные действия, такие как дивиденды, дробление акций и выпуск новых акций.
Параметры
Ряды: 1766; Колонка : 7
Период
с 16 января по 20 октября
Образец данных
Цена акций с объемом (январь 2016 г. — октябрь 2020 г.)
Исследовательский анализ данных
- Одномерный анализ — высокий
- Одномерный анализ — низкий
- Одномерный анализ — открытый
- Одномерный анализ — смежное закрытие
- Одномерный анализ — объем
- Тест автокорреляции и белого шума
- Анализ дистрибуции — Закрыть
- Факторный анализ (корреляция и общая дисперсия)
Одномерный анализ — высокий
Одномерный анализ — низкий
Одномерный анализ — открытый
Одномерный анализ —Смежное закрытие
Одномерный анализ —Объем
Автокорреляция и белый шум — близко
- Функция автокорреляции показывает постепенное уменьшение тренда, в то время как функция частичной автокорреляции отключается сразу после одного отставания.
- Таким образом, графики показывают, что модель AR (1) подходит для временного ряда.
- Вероятность белого шума составляет ~ 0, что подтверждает, что серия НЕ является белым шумом.
Анализ распространения – Закрыть
Факторный анализ
Фактор 1:высокий, низкий, открытый, закрытый, скорректированный закрытый
Фактор 2:объем
Фактор 1 и фактор 2 объясняют 83% и 17% дисперсии соответственно.
Разработка функций
Включенные функции
- VIX = индекс волатильности, используемый для измерения волатильности на рынке в этот день.
- High_Low = эта переменная представляет собой разницу между максимумом и минимумом за предыдущий день.
- VarianceLast7= Эта переменная дает дисперсию движения цены за последние 7 дней.
- Vol_Close = Эта переменная представляет собой соотношение объема и цены закрытия за предыдущий день.
- Ставка = реальная процентная ставка ФРС США.
- PER = отношение цены к доходу, как и в предыдущий день.
- LastMonthPER = отношение цены к доходу за последние 30 дней.
Исключенные функции
- Высокая = высокая переменная сильно коррелирует (>98%) с закрытием зависимой переменной.
- Низкий = низкий уровень переменной сильно коррелирует (>98%) с закрытием зависимой переменной.
- Открытие = Открытие переменной сильно коррелирует (>98%) с закрытием зависимой переменной.
- Adj.Close = Переменная Adj.Close сильно коррелирует (>98%) с закрытием зависимой переменной.
Корреляционный анализ
в сравнении с закрытием
- Vol_Close:-38%
- В прошлом месяце : -6%
- Объем:7%
- ДисперсияПоследняя7:7%
- VIX : 15%
- Высокий_низкий:18%
- PER :18%
- IntRate: 51%
- WkAvgClose : 99%
- Открыто: 100%
- Высокий уровень:100 %
- Низкий уровень: 100 %.
- Корректировка закрытия: 100%
Матрица корреляции показывает, что закрытие зависимой переменной сильно положительно коррелирует со средней недельной ценой закрытия, максимумом, минимумом, корректировкой закрытия и отрицательно коррелирует с Volume_Close и коэффициентом PE за последний месяц. VIX, процентная ставка и коэффициент PE имеют очень небольшую корреляцию с Close.
Факторный анализ — после разработки признаков
Отклонение объясняется каждым фактором
- Коэффициент 1:6,55
- Коэффициент 2 :4,21
- Коэффициент 3 :1,81
- Коэффициент 4 :0,56
- Коэффициент 5 :0,28.
- Коэффициент 6 :0,24
Моделирование прогнозов
- Период обучения: 5 лет (с 15 августа по 20 июля)
- Период прогнозирования: 3 месяца (с 20 августа по 20 октября)
Тест против прогноза
Заключение
High, Low, Open, Close, Adj Close сильно коррелируют друг с другом. Восходящий тренд и отсутствие сезонности демонстрируются всеми переменными, кроме объема, который показывает плоскую тенденцию. Зимняя модель ARIMAX и Holts работает лучше для этого варианта использования. Volume_Close отрицательно коррелирует с Close. Процентная ставка оказывает нейтральное влияние на цену закрытия. Вы можете найти код в github.
Поставьте лайк и подпишитесь, если вам понравился контент!