Автор BAM.money

В нашей предыдущей статье Цифровые данные: золотой рудник или мусорная свалка мы рассказали о потенциале цифровых данных для трейдеров. Но как трейдеры могут использовать эту информацию?

С точки зрения сигнала и учитывая все ловушки, трейдеры должны сосредоточиться на прогнозе текущей погоды вместо обычных моделей прогнозирования. Благодаря прогнозу текущей погоды трейдеры могут получить:

  • Прямые измерения, которые всегда верны, поскольку они не основаны на статистических отношениях опережения-запаздывания.
  • Краткосрочные прогнозы статистически более надежны, чем долгосрочные, что также означает, что большинство опубликованных открытий или сигналов в области финансов через некоторое время оказываются ложными.

Как опытный трейдер, вы знаете, как важно проверять ваши торговые сигналы на исторических данных для разработки или усовершенствования вашей торговой системы. Идея состоит в том, что ваши торговые стратегии, которые могли хорошо работать в прошлом, могут перестать работать в будущем. Если вы умны, но менее опытны в том, что машинное обучение могло принести на рынок, вы, возможно, не обратили внимания на то, как должно измениться тестирование на истории, чтобы действительно способствовать созданию альфа-версии и торговле в целом. Здесь есть две связанные проблемы: (а) машинное обучение может демократизировать доступ к отношениям данных, но, с другой стороны, (б) финансовые данные имеют очень низкое отношение сигнал/шум.

Мы определяем базовую структуру двумя способами:

  1. Мы идентифицируем по крайней мере два статистических набора, затем прогоняем результат по одному и сравниваем его с другим.
  2. Мы будем полагаться на рациональное наблюдение: если два набора очень похожи, результаты, вероятно, будут очень похожими. Когда это происходит, бэктестинг не информативен.

Из этого мы теперь знаем, что мы должны дифференцировать наборы данных. Поскольку мы фокусируемся на рыночных реалиях (благодаря принципу отсутствия арбитража), мы также должны отметить, что на финансовых рынках нет параллельных вселенных. Отсюда можно сделать вывод, что данные финансового рынка ограничены.

5 распространенных ловушек при тестировании на исторических данных

Самая важная ловушка, которую вы обнаружите при тестировании на исторических данных, связана с экономическими соображениями. Вот некоторые из других, которые я нашел за эти годы:

1: использование одних и тех же исторических данных или поиск комбинаций, дающих статистически значимые результаты (т. е. создание ложных срабатываний или отслеживание данных).

2: игнорирование рациональной экономической теории или ожидание того же результата в будущем, даже если не все условия одинаковы.

3: зная, что чем больше набор данных, тем больше вариантов поведения вы можете ожидать, но игнорируя исследования, которые показывают, что коэффициенты Шарпа быстро ухудшаются при применении стратегий, основанных на одних и тех же исторических данных.

4:когда все больше и больше трейдеров используют одни и те же сигналы, их сделки становятся очень многолюдными, а их сигналы менее мощными.

5: Отсутствие ограждений для защиты вас и вашей торговой системы. Теперь трейдеры должны как можно чаще тестировать и корректировать старые сигналы.

Может ли этот век больших данных предсказать будущее?

Ответ - нет. С машинным обучением заманчиво думать, что трейдеры могут творить чудеса и предсказывать будущее со всеми этими зеттабайтами данных и своими вычислительными ресурсами. К сожалению, хотя вы, безусловно, можете многому научиться с помощью сигналов, есть предел тому, что вы можете извлечь из данных, которые вы обрабатываете. Больше данных не всегда означает лучшие прогнозы.

Кроме того, в финансовом мире нет точных наборов данных вне выборки. На самом деле, единственная настоящая вневыборочная торговля — это торговля в реальном времени. Вот почему вы должны динамически и непрерывно тестировать на исторических данных. Объедините это с перекрестной проверкой, и вы будете отслеживать различные комбинации переменных.

Игнорируем ли мы экономическое обоснование?

Экономика, в отличие от многих других областей (например, физики, медицины), не может позволить себе роскошь проводить обширные тесты вне выборки. Когда вы это делаете, очень важно учитывать индивидуальное поведение (предпочтения, потребности и отношения человечества), которое меняется со временем. Вы можете разработать тесты, охватывающие различные экономические режимы, и увидеть прямое влияние изменений в индивидуальном и коллективном поведении и их влияние на модели и наборы данных.

Чтобы узнать больше, читайте нашу следующую статью "Как данные меняют финансовые рынки".

https://bam.money/