Чтобы получить общее представление о машинном обучении, прочитайте нашу ранее опубликованную статью Что такое машинное обучение?»

Автор BAM.money

Знаете ли вы, что к концу 2020 года объем всех цифровых данных в мире достигнет 40 зеттабайт (40 триллионов гигабайт)? Человеческому разуму трудно понять это ошеломляющее количество информации.

Чтобы представить это в перспективе, это означает, что средний человек создает 1,7 МБ данных каждую секунду (и увеличивается). И если вы поместите это на график, он покажет, что объем цифровых данных удваивался каждые два года в течение последних 10 лет.

Фактически, к 2025 году прогнозируется, что у нас будет 175 ЗБ данных. Но являются ли все эти данные информацией? Хотя не будет ошибкой думать, что цифровая эпоха принесла нам кладезь информации, реальность такова, что большая часть этих данных — это шум. Трейдеры, ищущие сигналы или чистые отфильтрованные данные, подтверждающие гипотезы, сталкиваются с критическим ограничением: временем.

Время имеет решающее значение при торговле активами, поскольку трейдеры должны принимать решения немедленно. Наличие большого количества шума мешает четко видеть вещи. Хотя нельзя ожидать, что торговые сигналы будут легко найдены, наивная экономическая теория утверждает, что в таких условиях поиск может оказаться бесполезным.

С другой стороны, рациональная экономическая теория говорит, что сигналы могут существовать в присутствии шума. Однако совокупная стоимость их обнаружения ограничена выгодами, полученными при торговле. В противном случае в ваше пространство войдут другие трейдеры, и ситуация больше не будет возникать.

Понимание рациональной экономической теории необходимо для понимания ограничений сигналов и важности надлежащего тестирования на исторических данных1.

Где искать сигналы?

На протяжении десятилетий экономисты говорили, что наблюдение за поведением цен может определить направление индивидуального и коллективного рыночного поведения. Исторически они считали, что рост и падение цен можно рассматривать как индикаторы рыночных настроений, включая объективную и субъективную информацию. Хотя такие предположения никогда не находили твердой теоретической или постоянной статистической поддержки, наблюдение за прямыми интересами людей может дать более правдоподобные результаты.

Что хорошо в том, что в нашем распоряжении есть зеттабайты данных со всего мира, так это то, что мы можем добывать сигналы из онлайн-взаимодействий. Кажется, что они предлагают новый взгляд на поведение участников рынка в периоды крупных колебаний рынка. Но что именно мы должны тестировать?

Чтобы узнать, как мы подходим к этому, прочитайте нашу следующую статью «За кулисами тестирования».

Почему текущий прогноз вместо прогнозирования

С точки зрения сигнала и учитывая все ловушки, трейдеры должны сосредоточиться на прогнозе текущей погоды вместо обычных моделей прогнозирования. Благодаря прогнозу текущей погоды трейдеры могут получить:

  • Прямые измерения, которые всегда верны, поскольку они не основаны на статистических отношениях опережения-запаздывания.
  • Краткосрочные прогнозы статистически более надежны, чем долгосрочные, что также означает, что большинство опубликованных открытий или сигналов в области финансов через некоторое время оказываются ложными.

К сожалению, для некоторых ученых и многих практиков распространенной, но шаткой практикой является проведение десятков тысяч ретроспективных тестов для определения многообещающей инвестиционной стратегии. Затем сообщается о лучшем выбранном тесте, как если бы имело место одно испытание. Затем это становится основой для публикации или для запуска нового фонда.

Если вы хотите узнать больше о навигации по цифровым данным, прочитайте нашу следующую статью За кулисами тестирования.

https://bam.money/