МОДЕЛИ ПРОГНОЗА АКЦИЙ

Распространенные ошибки, которых следует избегать в моделях прогнозирования цен на акции

Популярность моделей глубокого обучения в финансовой индустрии резко выросла за последнее десятилетие. Появление таких моделей в этом секторе связано с фундаментальными требованиями, а именно с автоматизацией, масштабированием и персонализацией. Однако следует ли мне использовать модели, показанные в различных статьях в Интернете, для прогнозирования роста стоимости акций?

Прогнозирование стоимости акций - интересная тема. Количество статей, опубликованных в Интернете, показывает популярность этой темы. Однако многие из них страдают фундаментальной ошибкой. В этой статье предлагаются некоторые из распространенных ошибок, которых следует избегать при создании многоэтапной модели прогнозирования цен на акции.

Ловушка 1. Перестановка данных временных рядов

Данные временного ряда - это последовательные данные, измеренные через определенные интервалы времени. Каждая точка данных в серии сильно зависит от предыдущих точек данных, а также рассказывает историю. Во время обучения следует избегать перетасовки данных временных рядов, чтобы сохранить временную зависимость. На рисунке показана дневная цена акций TESLA на закрытие в качестве примера данных временного ряда.

Ошибка 2: неправильный выбор длины окна

Понимание формы данных очень важно. Существуют определенные стандарты, которым необходимо следовать для формы входных данных в зависимости от библиотек Python для глубокого обучения. Следовательно, часто требуется изменение формы набора данных временных рядов.

На рисунке ниже показана цена закрытия акций TESLA за шесть месяцев. Постоянное окно длины (T) определяется для изменения формы данных временного ряда.

Используйте следующую формулу для расчета количества образцов (N), полученных после изменения формы.

Серия, состоящая из 13 точек данных (x1, x2, x3, ……., X13) с длиной T = 4 после изменения формы, дает 10 выборок.

Выбор правильного размера окна - гиперпараметр для моделей. На предсказуемость модели сильно влияет длина окна, если оно слишком велико или слишком мало.

Ловушка 3. Отказ от использования стационарных элементов

Модель, использующая только цену акций на конец периода в качестве характеристики, была бы крайне ненадежной, поскольку она динамична и непредсказуема, на нее влияют глобальная экономика, производительность компании, человеческие эмоции и многое другое. Среднее значение, дисперсия и ковариация нестационарных финансовых данных со временем меняются. Следовательно, использование цены акции на момент закрытия торгов может ввести в заблуждение. Тем не менее, в Интернете есть несколько статей, в которых для моделирования используются цены акций на момент закрытия.

Несколько исследований показали, что использование нескольких характеристик запаса привело к лучшему прогнозированию модели. Методы парной торговли сильно коррелированными акциями, скользящее среднее, стандартное отклонение, доходность акций, направление движения акций - это несколько жизнеспособных вариантов для изучения.

Чтобы преобразовать нестационарный характер финансовых данных в стационарные, обычно используются методы преобразования данных: уменьшение тренда, дифференцирование или и то, и другое. Используйте следующую формулу, чтобы получить доходность акций из цены акций на момент закрытия, в результате чего получается стационарный объект.

На рисунке показано внезапное изменение цены акций TESLA после марта 2020 года. Использование цены закрытия для прогнозирования акций может привести к сбою модели. Существует несколько методов, позволяющих проверить, достаточно ли одного дифференцирования или устранения тренда, чтобы сделать эту функцию стационарной или нет. Расширенный тест Дики-Фуллера (ADF) - известный тест, широко используемый для проверки стационарности. Ниже показан результат теста ADF для цены акций на конец периода по сравнению с доходностью акций для всего набора данных (10 лет).

Для простоты понимания, если статистика ADF ниже критического значения (здесь показано критическое значение 5%), то высока вероятность, что данные являются стационарными.

Ловушка 4: искажение прогнозов модели

Многие статьи показывают, что модели долгосрочной краткосрочной памяти (LSTM) очень эффективны при прогнозировании цен на акции. Даже с использованием нестационарных функций, таких как цены на акции на момент закрытия, можно достичь очень высокой точности прогнозов.

В этом разделе показана модель предсказателя цен на акции, основанная на модели LSTM, для проверки гипотезы. Для этого теста в статье используется цена закрытия в качестве входной характеристики и длина окна в 10 дней для воссоздания сценария.

На рисунке выше показан прогноз курса акций на 100 дней. Многие статьи часто останавливаются на этом, утверждая, что модель эффективна для многоэтапного прогнозирования. Однако это одна из самых существенных ошибок. На рисунке выше фактически не показано многоэтапное прогнозирование. Вместо этого он делает одношаговое прогнозирование (скорее, это задержка). Что это обозначает?

Как показано выше, в таких случаях модель принимает только фактические значения, чтобы предсказать следующее значение, показанное оранжевым. Однако правильная модель многоэтапного прогнозирования должна использовать предыдущие прогнозы в качестве входных данных для следующего прогноза.

На рисунке ниже показан тот же результат прогнозирования модели при использовании предыдущих прогнозов в качестве входных данных за 100 дней.

Модель не может сделать многоэтапный прогноз при правильном тестировании.

Еще раз о ловушке 3: отказ от стационарных объектов

Как указывалось ранее, построение модели с использованием нестационарного признака может вводить в заблуждение, поскольку модели трудно уловить внезапные изменения данных, которые могут возникнуть по разным причинам. Рисунок ниже подтверждает то же самое.

В этом случае не удается даже одношаговое прогнозирование, что указывает на необходимость использования стационарных функций для обучения модели.

Ловушка 5. Отказ от изучения литературы

Несколько книг могут дать отличное понимание основных предикторов, используемых в финансовой индустрии для прогнозирования акций. Следовательно, отправной точкой для таких моделей должен быть обзор литературы.

В своей следующей модели прогнозирования акций избегайте этих ловушек до тех пор -

«Живите долго и процветайте».

Надеюсь, вам понравилась эта статья. Любые вопросы? Я что-то упустил? Пожалуйста, напишите мне в LinkedIn или Twitter.

Перейдите по этой ссылке на Github, чтобы получить доступ ко всем ресурсам, использованным для этой статьи.

Ваше здоровье!

Рахул