Временные ряды, которые они меняют: почему все хорошие модели в конечном итоге терпят неудачу

Проверка на структурные разрывы с помощью теста чау-чау

После публикации истории я превратил свой код для теста Чау в пакет, доступный здесь.

Я немного написал о прогнозировании будущих цен на акции и распределения будущих цен на акции. Я горжусь моделями, которые построил для этих статей, но в конечном итоге они будут не более предсказуемыми, чем обезьяна, бросающая дротики в доску. Возможно, они выступят хуже.

Это произойдет потому, что система, лежащая в основе модели, изменится. В качестве крайнего примера, компания, акции которой мы пытаемся моделировать, обанкротилась. Временной ряд просто заканчивается. В качестве более тонкого примера рассмотрим взаимосвязь между ценами на нефть и курсами доллара.

Я взял исторический реальный обменный курс доллара США, измеренный по отношению к широкой корзине валют и цен на нефть (WTI) с января 1986 года по февраль 2019 года, и проиндексировал их по январю 2000 года. Затем я ввел натуральный логарифм каждого из них (и сделал поправку на инфляцию, чтобы получить реальная цена на нефть), потому что это дало бы нам реальный темп роста, если бы мы различали данные.

Как видите, со временем они кажутся обратно пропорциональными. Когда один поднимается, другой опускается. Это имеет смысл, потому что, когда люди за пределами США хотят покупать нефть, им часто требуются доллары для транзакции. Цены на нефть растут, и им нужно обменивать больше своей национальной валюты, чтобы купить такое же количество нефти. Это, в свою очередь, укрепляет доллар, и обменный курс снижается по мере увеличения спроса на доллары. (Обменный курс, равный 1, означает, что для покупки 1 единицы иностранной валюты требуется 1 доллар США. Если он равен 2, требуется 2 доллара США для покупки 1 единицы иностранной валюты. Если он равен 0,5, за 1 доллар США покупаются 2 единицы иностранной валюты. .).

Но остается ли обратное соотношение постоянным с течением времени? Существуют ли периоды, когда движение в одном соответствует большему движению в другом по сравнению с другими временами? Такое изменение соотношения цен на нефть и обменных курсов доллара США может происходить по разным причинам. Например, серьезный валютный кризис в регионе может поднять спрос на относительно безопасные доллары США, в то же время снизив спрос на нефть по мере ослабления экономики. Возможно, исчезнет куча валют и образуется одна основная, когда страны присоединятся к валютному союзу, например, к ЕС.

Обнаружение предполагаемого перерыва в указанную дату: тест чау-чау

Тест Чоу проверяет, равны ли истинные коэффициенты в двух разных регрессионных моделях. Нулевая гипотеза - они равны, а альтернативная - нет. Другими словами, нулевая гипотеза - это модель до возможной точки разрыва, такая же, как модель после возможной точки разрыва. Альтернативная гипотеза - модели для каждого периода разные.

Он формально проверяет это, выполняя F-тест с k и N1 + N2–2k степенями свободы по статистике Чоу, которая приведена ниже.

Модели в каждом из периодов (объединенная / полная выборка, 1, 2) должны иметь нормально распределенную ошибку со средним значением 0, а также независимые и одинаково распределенные ошибки, чтобы удовлетворять предположениям Гаусса-Маркова. Я реализовал тест Чоу с нуля на python, и внизу статьи есть ссылка на код.

Я использовал тест Чоу, чтобы проверить структурный разрыв при введении евро в январе 1999 года. Это кажется разумным возможным структурным разрывом. Несколько основных валют и некоторые второстепенные исчезли, и родился евро. Создание евро, безусловно, квалифицируется как серьезный шок для валютных рынков и, возможно, для отношения нефти к доллару.

Перевод независимо и идентично распределенных остаточных требований на английский язык переводится как постоянное среднее значение и дисперсия без последовательной корреляции в остатках. Чтобы проверить это, я проверил автокорреляцию и гетероскедастичность в своих остатках. Я проделал те же тесты на их темпах роста (разница в натуральных логарифмах). Я также нанес на график остатки и оценил их среднее значение.

Графики функции автокорреляции убедительно свидетельствуют о том, что остатки из простой модели OLS имеют сильную автокорреляцию, в то время как остатки из OLS темпов роста не автокоррелированы.

Тест Бреуша-Пагана показывает, что гетероскедастичность присутствует в модели OLS. Он также присутствует в модели темпов роста на уровне значимости 0,05, но гораздо менее серьезен. Гистограмма остатков показывает форму колоколообразной кривой для остатков модели OLS с учетом темпов роста, и их среднее значение составляет приблизительно 0. В итоге модель темпов роста OLS страдает от гетероскедастичности и имеет ненормально распределенные ошибки в полном объеме. -выборочный период. Несмотря на это, остатки имеют форму колокола со средним значением 0 и не являются автокоррелированными. Я продолжаю свой анализ после получения удовлетворительных результатов повторного выполнения этого анализа в периоды до и после евро.

Тест Чау вернул p-значение примерно 0,0009. Мы можем отвергнуть нулевую гипотезу о том, что модели до евро и после евро одинаковы.

Заключительные мысли

Помните, что при использовании модели временных рядов для прогнозирования будущего система может измениться. Следите за информацией, предполагающей, что что-то фундаментальное изменилось, и периодически проверяйте на структурные сдвиги. Также существует метод обнаружения структурных разрывов в неизвестные даты. Он заслуживает отдельной статьи, поэтому я не буду здесь его рассматривать, но поищите «совокупную сумму остатков для структурных разрывов», чтобы узнать больше.

Удачного прогнозирования.

код: https://gist.github.com/jkclem/49aa838585a8311e87e583c3e322309b