На финансовых рынках различные активы могут быть взаимозависимыми и, таким образом, прямо или косвенно влиять друг на друга под влиянием ряда факторов. Эти взаимодействия могут быть нелинейными, неустойчивыми и дальнодействующими. Такие отношения между активами играют решающую роль в определении риска, поскольку, вообще говоря, некоррелированный портфель активов имеет более низкий профиль риска, чем коррелированный. Однако корреляционные функции, используемые для изучения внутренних рыночных зависимостей, не могут точно отразить истинные взаимодействия, поскольку они описываются линейными моделями, а также не определяют направление влияния одного актива на другой. В этом сообщении блога мы рассмотрим трансферную энтропию (TE) как инструмент для объяснения того, какие аспекты рынка управляют другими, и проанализируем данные финансовых временных рядов с помощью эффективной сетевой модели, использующей концепцию многомерной трансферной энтропии.

Трансферная энтропия как направленная мера динамики информации

Передаточная энтропия рассматривается как модель в более широкой перспективе изучения распределенных внутренних вычислений в сложных системах [1]. Под многомерным временным рядом состояний понимается сложная система, и вычисление следующего состояния можно рассматривать как результат локального вычисления внутри системы в определенное время. С точки зрения динамики целевой переменной энтропия переноса направлена ​​на количественную оценку передачи информации, которая будет включена в модель, путем учета прошлого влияния источника с учетом прошлого цели. Таким образом, энтропия переноса количественно определяет количество информации о следующем наблюдении Xₙ процесса 𝑋, которое можно найти в наблюдении Yₙ процесса 𝑌 в контексте прошлого состояния 𝑿ₙ (𝑘) = {𝑋ₙ₋ₖ₊₁, … , Xₙ₋₁,Xₙ}.

В дополнение к учету избыточной информации из прошлого, обусловленность целевого прошлого позволяет энтропии переноса включать дополнительную информацию из исходного и целевого прошлого. Эта передача информации, количественно определяемая энтропией передачи, асимметрична по источнику и цели. Таким образом, переносная энтропия может быть использована для обнаружения таких асимметрий в системе, а также для различения движущей и реагирующей сил [2].

Хотя T(k) — это средняя передача информации от источника к получателю, которая помогает предсказать следующее значение в контексте некоторого конечного прошлого, мы также можем определить локальную энтропию передачи t(k) (как показано на рисунке выше) как передача информации от заданного источника к цели, имеющая отношение к прогнозированию ближайшего следующего значения в контексте прошлого. Локальная теоретико-информационная мера строится путем извлечения логарифмического члена из глобально усредненной меры. Метрика энтропии переноса представляет собой глобальное среднее значение этой локальной энтропии переноса при каждом наблюдении [3]. Локальная энтропия переноса может быть как положительной, так и отрицательной (с информативным или дезинформативным источником соответственно) и задает динамику переноса информации во времени.

Энтропию парного переноса можно использовать для понимания статистической согласованности между различными временными рядами в контексте финансов. Концепция парного переноса энтропии применялась ранее при анализе финансовых временных рядов для изучения взаимодействий между огромными рынками, например, между индексами Доу-Джонса и DAX [4], а также для анализа потока информации по отдельным акциям. , рассматривая, например, акции на NYSE [5] или компании с наибольшей рыночной капитализацией в мире [6].

Условная энтропия переноса, Многомерная энтропия переноса и Эффективный сетевой вывод

В этом посте мы рассмотрим использование многовариантного подхода к источникам, который выходит за рамки попарного подхода, который рассматривает один источник за раз.

Чтобы определить понятие условной переносной энтропии, мы можем рассмотреть, сколько информации о следующем наблюдении Xₙ процесса X можно найти в наблюдении Yₙ. процесса Y в контексте прошлого состояния 𝑿ₙ(𝑘) = {𝑋ₙ₋ₖ₊₁, … , Xₙ₋₁,Xₙ} и наблюдение Zₙ процесса Z. Математически условная переносная энтропия похожа на переносную энтропию, за исключением того факта, что она требует дополнительного обусловливания Z:

Дополнительное условие устраняет избыточность между исходным Y и условным Z, например общие эффекты драйвера (Z является общим драйвером для X и Y) или эффекты пути (например, передача между Y и X через Z) . Энтропия условного переноса также включает синергетический эффект между Y и Z, например синергетическую энтропию условного переноса, участвующую в операции XOR Xₜ = Yₜ-₁ XOR Zₜ-₁ , которые в противном случае не были бы захвачены в мерах попарной передачи энтропии.

Можно видеть, что информация в следующем состоянии адресата X разлагается на сумму (как описано на рисунке выше) сохраненной информации из его прошлого, добавочный вклад каждого источника в набор причинно-следственных факторов, влияющих на X, и оставшаяся неопределенность после рассмотрения всех этих источников.

Учитывая временные ряды для каждого набора переменных, мы стремимся представить предполагаемые направленные отношения между этими переменными с минимальной сетевой моделью для временных рядов узлов. Такой подход к эффективному сетевому выводу может отражать динамические изменения режима системы. Итеративные или жадные подходы с энтропией условного переноса могут как уловить синергию, так и избавиться от нежелательной избыточности, в то же время имея возможность улавливать нелинейные взаимодействия. В нашей задаче эффективного сетевого анализа цель состоит в том, чтобы определить набор исходных переменных для X, который максимизирует коллективную энтропию передачи от него к X, при условии, что каждый источник в наборе постепенно добавляет информацию в X статистически значимым образом. В случае примера с двумя источниками (как на рисунке выше) наша цель — вывести родительский набор {Y, Z} для X.

Теперь мы будем использовать пакет с открытым исходным кодом, набор инструментов IDTxl [8], который позволяет нам выполнять такой анализ динамики информации. Жадный подход к выводу родительского набора с использованием следующих шагов реализован в наборе инструментов IDTxl:

  1. Встроить целевое прошлое
  2. Установите родительский набор P как пустой набор.
  3. Оцените TE (источник -> цель | P), т. е. TE от каждого источника к цели, обусловленный P
  4. Добавить источник с максимальной условной энтропией переноса к P, если p-значение статистически значимо.
  5. Перейдите к шагу 2, если добавлен новый родитель, в противном случае перейдите к шагу 5.
  6. Сократите избыточные ссылки в конечном родительском наборе.
  7. Выполните статистический тест на всем родительском наборе.

Многомерный анализ трансфертной энтропии по выбранным данным об акциях США

Рассмотрим следующий набор из 20 акций, включенных в индекс S&P 500 с бирж NYSE (.N) и NASDAQ (.OQ): Adobe Systems Incorporated (ADBE.OQ), Air Products and Chemicals Inc (APD.N), CME Group. Inc (CME.OQ), ConocoPhillips (COP.N), Walt Disney Company (The)(DIS.N), Duke Energy Corporation (DUK.N), Intuit Inc (INTU.OQ), Mosaic Company (The) (MOS .N), Microsoft Corporation (MSFT.OQ), NRG Energy Inc (NRG.N), ONEOK Inc (OKE.N), O'Reilly Automotive Inc (ORLY.OQ), Red Hat Inc (RHT.N), Starbucks Corporation (SBUX.OQ), Sherwin-Williams Company (The) (SHW.N), Sempra Energy (SRE.N), Union Pacific Corporation (UNP.N), VeriSign Inc (VRSN.OQ), Xilinx Inc (XLNX. OQ), Exxon Mobil Corporation (XOM.N).

Данные, используемые в этом анализе, представляют собой смесь акций США на тиковом уровне (сделка за сделкой), агрегированные с почасовой периодичностью, с июля 2008 г. по декабрь 2018 г. TE анализируется с использованием немодальной оценки KSG (Kraskov). для нелинейных непрерывных данных. Мы используем логарифмическую доходность цен закрытия, определяемую как Rₜ = ln(Pₜ) − ln(Pₜ₋ ), где Pₜ — цена закрытия акции в момент времени t, а Pₜ₋₁ — цена закрытия той же акции в момент времени т-1. В случае нестационарной статистики формула TE может применяться к ансамблям, что неприменимо к данным финансовых временных рядов, поскольку существует только одна временная запись цен для данной акции.

При принятии решения о размере окна для временного окна, по которому мы усредняем локальные значения энтропии переноса, одно из соображений состоит в том, чтобы сохранить размер окна не слишком большим, чтобы статистика была приблизительно стационарной в пределах окна, но не слишком. малы либо настолько, что оценка TE ненадежна. Кроме того, окно для усреднения поддерживается достаточно большим, так что значения TE, сгенерированные путем усреднения локальных значений TE по окну, являются положительными.

В этом примере максимальный временной горизонт или максимальное окно задержки по источнику и цели фиксируется на 10 временных шагах. Статистические тесты используют p-значение 0,005.

Усреднение значений локальной трансферной энтропии с использованием кумулятивного временного окна, начиная с 2009 по 2018 год, может позволить нам увидеть динамическое взаимодействие между активами наряду с эволюцией финансового рынка, с информационным потоком между узлами, определяемым средней TE.

Во временной шкале мы видим постоянный источник -> целевая передача информации в направлении, среди прочего, SRE.N -> NRG.N и XLNX.OQ -> DIS.N. В случае с первой парой активов интересно отметить, что и Sempra Energy, и NRG принадлежат энергетическому сектору и, кроме того, имеют общую компанию по управлению инвестициями, связанную с ними. Однако направленный поток между Xylinx и Walt Disney, принадлежащими к совершенно разным секторам, удивителен. Мы также отмечаем из приведенного выше анализа, что при увеличении размера временного окна, по которому мы усредняем, среднее и максимальное значения энтропии переноса демонстрируют устойчивую тенденцию к снижению с 2009 по 2013 год, после чего она стабилизируется. Использование скользящего окна переменной длины во времени дает представление о развивающейся динамике отношений между различными активами.

Расчет многомерного TE требует больших вычислительных ресурсов, особенно при увеличении количества активов. Однако здесь мы справились с этим, используя параллельную обработку (checkout SCOOP [10]), чтобы распределить сетевой анализ для различных целей и назначить его рабочим процессам через кластер графического процессора. С помощью оценщика графического процессора число вычислений TE масштабируется как кубическое число ресурсов в наихудшем случае полностью подключенной сети, и каждое вычисление масштабируется как O(N²), где N — количество образцы во временном ряду.

Выполнение аналогичного анализа более крупной совокупности активов потенциально может привести к обнаружению кластеров активов, которые сильно влияют друг на друга при изменении рыночных условий, или аналогичных других кластеров, которые могут быть относительно изолированы с точки зрения потока информации. Это свойство энтропии передачи для определения источников и приемников при передаче информации между субъектами финансовой вселенной с несколькими активами может быть важным инструментом для выбора портфеля. Мы углубимся в это подробнее в следующей статье.

Об авторе

Арун — инженер-исследователь в Neuri Pte Ltd.

Ссылки:

  1. Боссомайер, Т., Барнетт, Л., Харре, М., Лизье, Дж. Т., Введение в перенос энтропии: поток информации в сложных системах, Springer, 2016 г.
  2. Квон, О. и О, Г. (2012), Асимметричный поток информации между рыночным индексом и отдельными акциями на нескольких фондовых рынках; Письма Еврофизики, 97 (2), 28007–28007.
  3. Джозеф Т. Лизье, Михаил Прокопенко и Альберт Ю. Зомая (2008), Локальная передача информации как пространственно-временной фильтр для сложных систем,Phys. Ред. Е 77, 026110
  4. Р. Марчински, Х. Канц (2002), Анализ потока информации между финансовыми временными рядами, European Physical Journal B 30 (2002) 275–281
  5. Сын Ки Бэк, Ву-Сунг Юнг, Окю Квон, Хи-Тэ Мун (2005), Трансферный энтропийный анализ фондового рынка.,ArXiv.org: physics/0509014v2
  6. Л. Сандовал (2014), Структура глобальной сети финансовых компаний на основе трансфертной энтропии,Entropy 16 (8), 4443–4482
  7. https://github.com/jlizier/jidt/blob/master/course/
  8. П. Вольштадт, Дж. Т. Лизье, Р. Висенте, К. Финн, М. Мартинес-Сарсуэла, П. Медиано, Л. Новелли, М. Вибрал (2018). IDTxl: The Information Dynamics Toolkit xl: пакет Python для эффективного анализа многомерной информационной динамики в сетях. Препринт ArXiv: https://arxiv.org/abs/1807.10459.
  9. Джозеф Т. Лизье и Микаил Рубинов. Многомерное построение эффективных вычислительных сетей по данным наблюдений. Институт Макса Планка: препринт, препринт №. 25, 2012
  10. Холд-Жоффруа, Янник и Ганьон, Оливье и Паризо, Марк. После того, как вы SCOOP, нет необходимости в ветвлении, Proceedings of the Annual Conference on Extreme Science and Engineering Discovery Environment, 2014 г., статья №60, 2014 г., ACM.