Стационарность и предсказуемость временных рядов, частным случаем которых является память временных рядов, являются фундаментальными понятиями для количественного инвестиционного процесса. Однако это часто неправильно понимают как практики, так и исследователи, о чем свидетельствует глава 5 недавно вышедшей книги Достижения в области финансового машинного обучения. Я имел удовольствие разъяснить эти заблуждения с некоторыми участниками Рост машинного обучения в управлении активами в Йельском университете на прошлой неделе после конференции, но я пришел к выводу, что проблема настолько широко распространена, что заслуживает публичного обсуждения. обсуждение.

В этом посте я делаю несколько плохо задокументированных замечаний о нестационарности и памяти на финансовых рынках, некоторые из которых идут вразрез с ортодоксией эконометрики. Все аргументы подкреплены логикой, математикой, контрпримерами и / или экспериментами с кодом Python в конце.

Приведенные здесь аргументы можно разделить на практические и технические:

Технические выводы:

  • Невозможно проверить, является ли временной ряд нестационарным с одним путем, наблюдаемым в течение ограниченного временного интервала, независимо от того, насколько долго. Каждый статистический тест на стационарность делает дополнительное предположение о семействе диффузий, к которому принадлежит основной процесс. Таким образом, отклонение нулевой гипотезы может представлять либо эмпирическое свидетельство того, что предположение о диффузии неверно, либо то, что предположение о диффузии верно, но нулевая гипотеза (например, наличие единичного корня) ложна. Статистический тест сам по себе не позволяет сделать вывод о том, какой сценарий верен.
  • Вопреки тому, что утверждается в Достижениях в области финансового машинного обучения, не существует дилеммы стационарности и памяти (одно не имеет ничего общего с другим), а память не подразумевает асимметрии или чрезмерного эксцесса.
  • Итерированное дифференцирование временного ряда по Боксу-Дженкинсу не делает временной ряд более стационарным, оно делает временной ряд более без памяти; временной ряд может быть как без памяти, так и нестационарным.
  • Важно отметить, что нестационарность, но временные ряды без памяти могут легко обмануть тесты стационарности (единичный корень).

Понятия памяти и предсказуемости временных рядов тесно связаны, о чем мы говорили в нашей Желтой книге. Я воспользуюсь этой возможностью, чтобы поделиться нашим подходом к количественной оценке памяти во временных рядах.

Практические выводы:

  • То, что рынки (в частности, финансовые временные ряды) нестационарны, имеет интуитивный смысл, но любая попытка доказать это статистически обречена на провал.
  • Для количественного управления инвестициями нужна стационарность, но не стационарности финансовых временных рядов, «стационарность» или постоянство торгуемых моделей или альфа на протяжении (достаточно долгого ) временной горизонт).

Стационарность

Проще говоря, стационарность - это свойство вещей, которые не меняются со временем.

Менеджеры по количественным инвестициям нуждаются в стационарности

В основе каждой попытки количественного управления инвестициями лежит предположение о том, что на рынках существуют модели, которые преобладали в прошлом, которые будут преобладать в будущем, и которые можно использовать для зарабатывания денег на финансовых рынках.

Успешный поиск этих шаблонов, часто называемых альфа-версиями, и ожидание того, что они сохранятся с течением времени, обычно требуется до развертывания капитала. Таким образом, стационарность - это желаемое за действительное, присущее количественному управлению инвестициями.

Стационарность на финансовых рынках разрушительна

Однако альфы часто становятся жертвами собственного успеха. Чем лучше альфа-версия, тем больше вероятность того, что конкуренты со временем скопируют ее, и, следовательно, тем выше вероятность того, что со временем она исчезнет. Следовательно, каждый прогнозируемый образец обязательно должен быть временным или переходным режимом. Как долго продлится режим, зависит от строгости, использованной в альфа-поиске, и секретности, связанной с его использованием.

Эфемерность альфы хорошо задокументирована; см., например, последнюю книгу Игоря Тульчинского Неуправляемые: человек, машины и стремление к господству на рынках, которую я очень рекомендую.

Что касается широко распространенного мнения, что финансовые рынки в высшей степени нестационарны, то нестационарность часто понимается в математическом смысле и обычно относится к финансовым временным рядам.

Стационарность временных рядов нельзя опровергнуть с помощью одной конечной выборки

В случае временных рядов (также известных как случайные процессы) стационарность имеет точное значение (как и ожидалось); по сути два.

Временной ряд называется строго стационарным, если все его свойства инвариантны из-за изменения начала отсчета времени или перевода времени. Временной ряд называется стационарным или слабо стационарным, если его среднее значение и автоковариационные функции инвариантны при изменении начала отсчета времени или трансляции времени. .

Интуитивно стационарный временной ряд - это временной ряд, локальные свойства которого сохраняются с течением времени. Поэтому неудивительно, что это было центральным предположением в эконометрике в течение последних нескольких десятилетий, настолько, что часто думается, что практикующим специалистам следует сначала сделать временной ряд стационарным, прежде чем проводить какое-либо моделирование, по крайней мере, в модели Бокса-Дженкинса. школа мысли.

Это абсурдно по той простой причине, что стационарность (второго порядка) как свойство не может быть опровергнута с помощью одного конечного пути выборки. Да, вы правильно прочитали! Прочтите, чтобы понять почему.

Но прежде чем углубляться в почти философский аргумент, давайте рассмотрим конкретный пример.

Рассмотрим сюжет выше. Это график стационарного временного ряда? Если бы вы ответили просто на основе этого сюжета, вы, вероятно, пришли бы к выводу, что это не так. Но я уверен, что вы видите, что уловка приближается, поэтому вы, вероятно, захотите провести так называемый тест стационарности, возможно, один из наиболее широко используемых, расширенный тест Дики-Фуллера. Вот что вы получите, если сделаете это (исходный код в конце):

ADF Statistic: 4.264155
p-Value: 1.000000
Critical Values:
	1%: -3.4370
	5%: -2.8645
	10%: -2.5683

Как видите, тест ADF не может отвергнуть нулевую гипотезу о том, что временной ряд представляет собой AR с единичным корнем, что (отчасти) подтвердит вашу первоначальную интуицию.

Теперь, если бы я сказал вам, что приведенный выше график основан на гауссовском процессе со средним значением 100 и функцией автоковариации

то я уверен, что вы согласитесь, что это действительно результат (строго) стационарного временного ряда. В конце концов, и его среднее значение, и автоковариационная функция инвариантны при переводе во времени.

Если вы все еще в затруднении, вот тот же рисунок за гораздо более длительный период времени:

Я уверен, вы, должно быть, думаете, что это больше похоже на то, что вы ожидаете от стационарного временного ряда (например, это визуально возвращается к среднему). Давайте подтвердим это с помощью нашего теста ADF:

ADF Statistic: -4.2702
p-Value: 0.0005
Critical Values:
	1%: -3.4440
	5%: -2.8676
	10%: -2.5700

В самом деле, мы можем отклонить нулевую гипотезу о нестационарности временных рядов при p-значении 0,05%, что дает нам сильную уверенность.

Однако процесс не изменился между двумя экспериментами. На самом деле даже случайный путь один и тот же, и в обоих экспериментах достаточно точек (не менее тысячи в каждом). Так что не так?

Интуитивно понятно, что хотя первый эксперимент имел достаточно большой размер выборки, он не охватывал достаточно длинный временной интервал, чтобы быть характерным для основного процесса, и нет никакого способа мы могли знать это заранее!

Вывод заключается в том, что просто невозможно проверить, является ли временной ряд стационарным, исходя из единственного пути, наблюдаемого в течение конечного временного интервала, без каких-либо дополнительных предположений.

Часто делаются два предположения, но они обычно упускаются из виду как практиками, так и исследователями, что приводит к неверным выводам; неявное предположение и явное предположение.

  1. Неявное предположение

Стационарность - это свойство случайного процесса, а не пути. Попытка проверить стационарность по единственному пути должна неявно полагаться на предположение, что рассматриваемый путь достаточно информативен о природе лежащего в основе процесса. Как мы видели выше, это может быть не так и, что более важно, невозможно исключить эту гипотезу. Поскольку путь не выглядит средним, это не означает, что лежащий в основе процесс не является стационарным. Возможно, вы не наблюдали достаточно данных, чтобы охарактеризовать весь процесс.

Вдоль этой линии любой финансовый временной ряд, независимо от того, проходит он тест ADF или нет, всегда может быть расширен до временного ряда, который проходит тест ADF (подсказка: существуют стационарные случайные процессы, пространство путей которых универсально). Поскольку мы не знаем, что нас ждет в будущем, строго говоря, утверждение, что финансовые временные ряды нестационарны, является немного неправильным, по крайней мере, в той же степени, что и утверждение, что финансовые временные ряды являются стационарными.

При отсутствии доказательств стационарности временной ряд не следует считать нестационарным - мы просто не можем статистически отдавать предпочтение одному свойству над другим. Это работает аналогично любому логическому рассуждению о бинарном предложении A: никакое свидетельство того, что A верен, никогда не является свидетельством того, что A не верен.

Предположение о нестационарности финансовых рынков может иметь больше практического смысла как аксиома, чем предположение о том, что рынки являются стационарными. по структурным причинам. Например, было бы неплохо ожидать, что производительность, население мира и мировой объем производства, все из которых связаны с фондовыми рынками, со временем увеличатся. Однако это не имело бы более статистического смысла, и это рабочая гипотеза, которую мы просто не можем опровергнуть (в инсоляции) в свете данных.

2. Явное предположение

Каждый статистический тест на стационарность основан на предположении о классе диффузий, в котором должна лежать диффузия основного процесса. Без этого мы просто не сможем построить статистику для использования в тесте.

Обычно используемые тесты (единичный корень) обычно предполагают, что истинное распространение - это авторегрессионный процесс или процесс AR, и проверяют отсутствие единичного корня в качестве прокси для стационарности.

Подразумевается, что такие тесты не имеют нулевой гипотезы о том, что основной процесс нестационарен, а о том, что основной процесс является нестационарным процессом AR!

Следовательно, эмпирические данные, ведущие к отклонению нулевой гипотезы, могут указывать либо на то, что лежащий в основе процесс не является AR, либо на то, что он не является стационарным, либо и то, и другое! Одних тестов на единичный корень недостаточно, чтобы исключить возможность того, что базовый процесс не может быть процессом AR.

То же самое справедливо и для других тестов на стационарность, которые делают другие предположения о лежащей в основе диффузии. Без модели нет статистической проверки гипотез, и никакая проверка статистической гипотезы не может подтвердить допущение модели, на котором она основана.

Ищите стационарные альфы, а не стационарные временные ряды

Учитывая, что мы не можем проверить, является ли временной ряд стационарным, не делая предположений о его распространении, мы сталкиваемся с двумя вариантами:

  • Сделайте предположение о диффузии и стационарности теста.
  • Изучите прогностическую модель с допущением стационарности или без него

Первый подход наиболее часто используется в литературе по эконометрике из-за влияния метода Бокса-Дженкинса, тогда как последний больше соответствует духу машинного обучения, заключающемуся в гибком изучении распределения генерируемых данных на основе наблюдений.

Моделирование финансовых рынков сложно, очень сложно, поскольку рынки представляют собой сложные, почти хаотические системы с очень низким отношением сигнал / шум. Любая попытка правильно охарактеризовать динамику рынка - например, попытаться построить стационарные преобразования - как требование для построения альфа, является смелой, нелогичной и неэффективной.

Альфа - это функции рыночных характеристик, которые могут в некоторой степени предвосхищать движения рынка в абсолютном или относительном выражении. Чтобы доверять, следует ожидать, что альфа будет сохраняться с течением времени (т.е. быть стационарной в широком смысле). Однако, является ли сам процесс, лежащий в основе, стационарным или нет (в математическом смысле), совершенно не имеет значения. Ценность, размер, импульс и перенос - вот некоторые примеры хорошо задокументированных торговых идей, которые работали десятилетиями и не связаны со стационарностью рядов цены или доходности.

Но хватит стационарности, давайте перейдем к природе памяти на рынках.

объем памяти

Интуитивно следует думать, что временной ряд имеет память, когда его прошлые значения связаны с его будущими значениями.

Чтобы проиллюстрировать распространенное заблуждение о памяти, давайте рассмотрим простой, но показательный пример. В Достижения в области финансового машинного обучения автор утверждает, что

«Большинство экономических анализов следует одной из двух парадигм:

  • Бокс-Дженкинс: возврат стационарный, но без памяти
  • Энгл-Гангер: Лог-цены имеют память, однако они нестационарны, а совместная интеграция - это уловка, которая заставляет регрессию работать с нестационарными временными рядами […] »

Чтобы получить лучшее из обоих слов, автор предлагает построить процесс взвешенного скользящего среднего.

коэффициенты которого определяются на основе понятия дробного дифференцирования с фиксированным окном, в качестве альтернативы логарифмической доходности (дифференциация первого порядка по логарифмическим ценам). Автор рекомендует выбирать наименьшую степень дробного дифференцирования 0 ‹d‹ 1, для которой временной ряд скользящего среднего проходит тест стационарности ADF (при заданном значении p).

В целом подход вызывает несколько вопросов:

  • Действительно ли существует дилемма между стационарностью и памятью?
  • Как мы можем количественно измерить память во временных рядах, чтобы подтвердить, являются ли они без памяти?
  • Если предположить, что мы сможем найти стационарное преобразование скользящего среднего с большим объемом памяти, как это поможет нам сгенерировать более качественные альфы?

Количественная оценка памяти

Интуитивно легко увидеть, что процессы скользящего среднего обладают памятью по своей конструкции (последовательные наблюдения скользящего среднего обязательно должны быть связаны, поскольку они частично вычисляются с использованием тех же наблюдений входного временного ряда). Однако не каждый временной ряд, имеющий память, является скользящей средней. Чтобы определить, есть ли у стационарных временных рядов память, необходимо иметь структуру для количественной оценки памяти в любых временных рядах. Мы рассмотрели эту проблему в нашей Желтой книге, и вот ее краткое содержание.

Качественный вопрос, которым руководствуется любой подход к измерению памяти во временных рядах, заключается в следующем. Сообщает ли нам прошлое о будущем? Иными словами, уменьшает ли знание всех прошлых значений до настоящего момента нашу неопределенность относительно следующего значения временного ряда?

Канонической мерой неопределенности случайной величины является ее энтропия, если она существует.

Точно так же неопределенность, оставшаяся в случайной величине после наблюдения другой случайной величины, обычно измеряется условной энтропией.

Таким образом, возможной мерой памяти во временном ряду является уменьшение неопределенности относительно будущего значения временного ряда, которое может быть достигнуто путем наблюдения за всеми прошлыми значениями в предельном случае бесконечного числа таких прошлых значений. Мы называем это мерой автоматической предсказуемости временного ряда.

Когда он существует, мера автопредсказуемости всегда неотрицательна и равна нулю тогда и только тогда, когда все выборки временного ряда во времени являются взаимно независимыми (т.е. прошлое не связано с будущим, или временной ряд не имеет памяти. ).

В случае стационарных временных рядов PR ({X}) всегда существует и определяется разницей между энтропией любого наблюдения и скоростью энтропии временного ряда.

В нашей Желтой книге мы предлагаем подход на основе максимальной энтропии для оценки PR ({X}). На следующем графике показано, сколько памяти имеется в акциях, фьючерсах и валютах.

Память не имеет ничего общего со стационарностью

Прямым следствием приведенного выше обсуждения является то, что временной ряд может быть как стационарным, так и иметь большой объем памяти. Одно не исключает другого, и фактически одно просто не связано с другим.

Действительно, в случае стационарных гауссовских процессов можно показать, что мера автопредсказуемости имеет вид

Стоит отметить, что PR ({X}) = 0 тогда и только тогда, когда спектр мощности постоянен, то есть временной ряд представляет собой стационарный гауссовский белый шум, в противном случае PR ({X}) ›0. Стационарному белому шуму не хватает памяти, потому что он неподвижен, ему не хватает памяти, потому что это, ну […], белый шум!

Чем более неравномерно спектр мощности, тем больше памяти во временном ряду. Чем более плоская функция автоковариации, тем круче спектр мощности и, следовательно, выше показатель автопредсказуемости и тем больше памяти имеет временной ряд. Примером такой плоской автоковариационной функции является квадратно-экспоненциальная ковариационная функция.

в пределе, когда входной параметр масштаба длины l стремится к бесконечности.

Короче говоря, нет дилеммы стационарности и памяти. Путаница в умах практикующих возникает из-за неправильного понимания того, что происходит во время повторной дифференциации, как это предлагается в методологии Бокса-Дженкинса. Подробнее об этом в следующем разделе.

Память не имеет ничего общего с перекосом / эксцессом

Другое заблуждение относительно памяти (см., Например, главу 5, стр. 83 вышеупомянутой книги) состоит в том, что есть «асимметрия и избыточный эксцесс, который приходит с памятью». Это тоже неверно. Как обсуждалось ранее, можно генерировать временные ряды, которые являются гауссовскими (следовательно, не искаженными и не лептокуртическими), стационарными и имеют произвольно длительную память.

Повторяющееся дифференцирование, стационарность и память

Итерированное дифференцирование не делает временной ряд более стационарным, оно делает временной ряд более без памяти!

Дифференциация (дискретного времени) временных рядов в смысле оператора обратного сдвига работает очень похоже на дифференциацию кривых, изученных в средней школе.

Чем больше мы продолжаем дифференцировать кривую, тем больше вероятность того, что кривая претерпит разрыв / резкое изменение (если, конечно, она не является бесконечно дифференцируемой).

Интуитивно, в том же ключе, чем больше временной ряд дифференцируется в смысле оператора обратного сдвига, тем большему количеству шоков (в стохастическом смысле) будет подвергаться временной ряд, и, следовательно, чем ближе будут его выборки к взаимной независимости, но не обязательно одинаково распределены!

После того, как временной ряд был дифференцирован достаточно раз и стал без памяти (т. Е. Имеет взаимно независимые выборки), это, по сути, случайное блуждание, хотя и не обязательно стационарное . Мы всегда можем построить нестационарный временной ряд, который, сколько бы раз он ни дифференцировался, никогда не станет стационарным. Вот пример:

Его дифференцирование по порядку 1 полностью без памяти, поскольку приращения винеровского процесса независимы.

Его функция дисперсии g (t) изменяется во времени, и поэтому {y} нестационарна.

Точно так же дифференцирование {y} порядка (d + 1) является как без памяти, так и нестационарным для любого d ›0. В частности, последующие повторные дифференцирования читаются как

и их зависящие от времени функции дисперсии читаются как

Это выражение явно расширяется в t для каждого d и не сходится в d для любого t. Другими словами, последовательные дифференцирования не выравнивают функцию дисперсии и, следовательно, не делают этот временной ряд более стационарным!

Случайное блуждание, стационарное или нет, обычно проходит большинство тестов на единичный корень!

Путаница в умах практикующих по поводу повторной дифференциации и стационарности проистекает из того факта, что большинство тестов на единичный корень заключает, что временной ряд без памяти является стационарным, хотя это не обязательно так.

Рассмотрим, например, тест ADF.

Если временной ряд {y} не имеет памяти, но не является стационарным, соответствие обычным методом наименьших квадратов (OLS), лежащее в основе теста ADF, не может привести к идеальному соответствию. Как это отклонение будет объяснено OLS с достаточно большой выборкой? Поскольку временной ряд не имеет памяти, OLS обычно обнаруживает свидетельство того, что γ близко к 1, так что тест ADF должен отклонить нулевую гипотезу о том, что γ = 0, чтобы сделать вывод о том, что временной ряд не имеет единичного корня (т. Е. стационарный АР). Изменяющаяся во времени дисперсия {y} обычно наблюдается с помощью члена стационарного шума {e}.

Чтобы проиллюстрировать этот момент, мы генерируем 1000 случайных розыгрышей равномерно в диапазоне от 0 до 1, и мы используем эти розыгрыши как стандартные отклонения 1000 независимо сгенерированных гауссиан со средним нулевым значением. Результат представлен ниже.

Тестовый прогон ADF на этом образце явно отвергает нулевую гипотезу о том, что временной ряд является результатом AR с единичным корнем, как видно из статистики ниже.

ADF Statistic: -34.0381
p-Value: 0.0000
Critical Values:
	1%: -3.4369
	5%: -2.8644
	10%: -2.5683

На этом этапе практики часто приходят к выводу, что временной ряд должен быть стационарным, что неверно.

Как обсуждалось ранее, временной ряд, который не является нестационарным AR, не обязательно является стационарным; это либо вообще не временной ряд AR, либо это стационарный AR. Как правило, сам тест ADF не позволяет сделать вывод о том, какое из двух утверждений верно. Однако в этом примере мы знаем, что предположение, которое неверно, не является нестационарностью, это допущение AR.

Заключительные мысли

Большое внимание было уделено влиянию ИИ на индустрию управления инвестициями в средствах массовой информации: статьи, поднимающие шумиху вокруг ИИ, предупреждают о риске переобучения при тестировании на исторических данных, утверждая, что соотношение сигнал / шум на финансовых рынках является нормальным. совершить революцию в области искусственного интеллекта или даже заявить, что искусственный интеллект существует в отрасли уже несколько десятилетий.

В этих СМИ машинное обучение часто рассматривается как статичное поле, экзогенное для финансового сообщества, набор общих методов, разработанных другими. Однако специфика отрасли управления активами требует появления новых методологий машинного обучения, разработанных с самого начала с ориентацией на финансы и ставящих под сомнение давно устоявшиеся догмы. Одним из самых больших препятствий на пути к появлению таких методов является, возможно, широко распространенное непонимание простых, но фундаментальных понятий, таких как стационарность и память, которые лежат в основе исследовательского процесса.

Приложение: код