Какова вероятность прибыли вашей следующей сделки? (Представляем PredictNow.Ai)

Эрнест Чан

Какова вероятность прибыли вашей следующей сделки? Казалось бы, каждый трейдер может ответить на этот простой вопрос. Скажем, вы просматриваете свои исторические сделки (в реальном времени или на истории), подсчитываете прибыльные и проигрышные сделки и получаете процент выигрышных сделок, скажем, 60%. Вероятность получения прибыли вашей следующей сделкой равна 0,6? Это может быть хорошей начальной оценкой, но это также совершенно бесполезное число. Позволь мне объяснить.

Это 0,6 можно назвать безусловной вероятностью прибыли. Он одинаков для каждой сделки, которую вы когда-либо совершаете (если только ваш коэффициент выигрыша существенно не изменится в будущем), поэтому он бесполезен в качестве руководства для того, следует ли вам заключать следующую конкретную сделку или нет. Конечно, он может сказать вам, следует ли вам торговать по этой стратегии в целом (например, вы можете не хотеть торговать стратегией с безусловной вероятностью прибыли, также известной как коэффициент выигрыша, менее 0,51). Но это не может быть сделано на основе торговли за торговлей. Последняя представляет собой условную вероятность получения прибыли. Как следует из прилагательного, эта вероятность обусловлена ​​конкретной рыночной конъюнктурой в то время, когда вы собираетесь торговать.

Допустим, вы торгуете по короткой стратегии волатильности. Это может быть алгоритмическая или даже дискреционная стратегия. Если вы торгуете на очень спокойном рынке, вполне вероятно, что ваша условная вероятность получения прибыли будет довольно высокой. Если вы торгуете во время финансового кризиса, она может быть очень низкой. Условия, которые могут определять вероятность, могут даже поддаваться количественному определению. Уровень VIX? Недавний SPY возвращается? Как насчет изменения процентной ставки или только что объявленного номера Нефермерской платежной ведомости? Или даже % изменения случаев Covid-19 за предыдущий день? Возможно, вы не принимали во внимание все эти бесчисленные цифры, когда строили свою простую торговую стратегию или когда решали совершить дискреционную сделку, но вы не можете отрицать, что они могут влиять на условную вероятность прибыли. Так как же нам рассчитать эту вероятность?

Осторожно, спойлер: вычисление этой условной вероятности помогло нам получить 64% дохода с начала года по состоянию на июнь 2020 года. Вы можете узнать, как это сделать, с помощью predictnow.ai. Но об этом чуть позже.

Единственный известный способ вычислить эту условную вероятность — машинное обучение. Вернемся к приведенному выше примеру вашей короткой стратегии волатильности. Предположим, вы подготавливаете таблицу доходности по историческим сделкам, которую вы совершили, как на рис. 1.

Опять же, эти сделки могут быть связаны с алгоритмом или могут быть дискреционными (возможно, основанными на некоторой комбинации фундаментального анализа и интуиции, как это делает Уоррен Баффет).

Теперь предположим, что нас заботит только то, прибыльны они или нет, поэтому мы игнорируем величину доходности и помечаем те сделки, которые прибыльны, 1, иначе 0. (Маркос Лопес де Прадо, пионер это финансовый метод машинного обучения. Они являются мета, потому что он предположил, что исходная простая стратегия используется для прогнозирования взлетов и падений самого рынка — это базовые прогнозы или ярлыки. Метаметки зависят от того, верны ли эти базовые прогнозы или нет.) Полученная таблица выглядит так, как показано на рис. 2.

Просто, верно? Теперь самое сложное. Ваша интуиция подсказывает вам, что есть некоторые переменные, которые вы не учли в своей первоначальной, простой торговой стратегии. Этих переменных слишком много, и вы не знаете, как их включить, чтобы улучшить свою торговую стратегию. Вы даже не знаете, бесполезны ли некоторые из них. Но это не проблема для машинного обучения. Вы можете добавить столько переменных, называемых признаками/предикторами/независимыми переменными, сколько хотите, полезных или нет. Алгоритм машинного обучения избавится от бесполезных функций с помощью процесса, называемого выбором функций. Но об этом чуть позже.

Итак, скажем, для каждой исторической сделки (представленной строкой в ​​электронной таблице) вы собираете некоторые характеристики, такие как VIX, доход SPY за 1 день, изменение процентной ставки за предыдущий день и т. д. Мы, конечно, должны убедиться, что эти значения функций были известны до момента входа в каждую сделку, в противном случае будет иметь место предвзятость, и вы не сможете использовать эту систему для реальной торговли. Итак, вот как может выглядеть ваша электронная таблица, дополненная функциями:

Хорошо, теперь, когда вы подготовили все эти исторические данные, как вы строите (или обучаете, говоря языком машинного обучения) прогностическую модель на их основе? Вы можете этого не знать, но вы, вероятно, уже использовали простейшую модель машинного обучения, возможно, еще на уроке статистики в колледже. Это называется линейной регрессией или близкой к ней логистической регрессией для нашей бинарной (прибыльной или нет) задачи классификации. Те функции, которые вы создали выше, — это просто независимые переменные, часто называемые X (вектор многих переменных), а метки — это просто зависимая переменная, часто называемая Y (со значениями 0 или 1). Но применение линейной или логистической регрессии к большому несопоставимому набору признаков для предсказания метки обычно терпит неудачу, потому что многие взаимосвязи не могут быть охвачены линейной моделью. Необходимо обнаружить и использовать нелинейные взаимозависимости между этими предикторами. Например, возможно, когда VIX ‹ = 15, доходность SPY за 1 день бесполезна для прогнозирования вероятности получения прибыли по вашей сделке. Но когда VIX ›= 15, 1-дневный доход SPY очень полезен. Этот тип отношений лучше всего обнаруживается с помощью контролируемого алгоритма иерархического обучения, называемого случайным лесом, который мы реализовали на predictnow.ai.

Алгоритм случайного леса может выявить гипотетическую взаимосвязь между VIX, однодневной доходностью SPY и т. д. и прибыльностью вашей короткой сделки по объему, как показано на этой схематической диаграмме:

Чтобы построить это дерево и все его двоюродные братья, которые вместе образуют случайный лес, все, что вам нужно сделать, это загрузить приведенную выше таблицу на predictnow.ai, нажать кнопку, и это, вероятно, будет сделано менее чем за 15 минут, часто гораздо раньше. (Конечно, быстрее, чем доставка пиццы.)

Как только этот случайный лес будет построен (обучен) с использованием исторических данных, он будет готов к вашей реальной торговле. Вы можете просто вставить последние значения для VIX, 1-day SPY и любых других функций в новую электронную таблицу, подобную этой:

Обратите внимание, что формат этой электронной таблицы такой же, как и у обучающих данных, за исключением того, что, конечно, нет известного возврата — мы надеемся предсказать это! Вы можете загрузить это на predictnow.ai вместе с моделью, которую вы только что обучили, нажмите PREDICT,

и вуаля! Теперь вы можете загрузить прогноз случайного леса о том, будет ли эта сделка прибыльной и с какой условной вероятностью.

Один из выходных файлов (слева на рис. 10) сообщает вам наиболее вероятный результат вашей сделки: прибыль или нет. Другой файл (правый на рис. 10) сообщает вам вероятность этого исхода. Вы можете использовать эту вероятность для определения размера сделки. Например, вы можете решить, что если вероятность прибыли выше 0,6, вы купите TSLA на 10 000 долларов. Но если вероятность находится между 0,51 и 0,6, вы купите только 5 тысяч долларов, а если вероятность ниже 0,51, вы не купите вообще.

Обычно прогноз в реальном времени занимает 1 секунду или меньше, в то время как обучение (которое может не потребоваться повторять чаще, чем раз в квартал) обычно не занимает более 15 минут даже для тысяч строк исторических данных со 100 функциями. . Вы можете делать прогнозы в режиме реального времени сколь угодно часто (т.е. так часто, как меняется ваш ввод), но если вы являетесь высокочастотным трейдером, вы захотите использовать наш API, чтобы наши прогнозы могли быть беспрепятственно интегрируется с вашей торговой системой.

Но предсказание условной вероятности прибыли для вашей следующей сделки — это еще не все, что мы можем сделать. Мы также можем сказать вам, какие функции важны для этого прогноза. На самом деле, это может вас заинтересовать больше, чем предсказание черного ящика, потому что этот список важных функций, отсортированных в порядке убывания важности, может помочь вам улучшить вашу базовую простую торговую стратегию. Другими словами, это может помочь улучшить вашу интуицию в отношении того, что работает с вашей стратегией, чтобы вы могли изменить свои торговые правила.

Возвращаясь к нашему примеру, predictnow.ai может сгенерировать для вас такой график:

Вы можете видеть, что VIX был признан наиболее важной функцией, за которой следовал доход SPY за 1 день, последнее изменение процентной ставки и так далее. Наш внутренний алгоритм прогнозирования фактически удалит все функции, которые «ниже среднего», и переобучит модель, но вы можете извлечь выгоду из включения только VIX и 1-дневной доходности SPY в свою простую стратегию, когда она генерирует торговый сигнал. Помните, что ваша простая стратегия не обязательно должна быть алгоритмической стратегией. Это может быть дискреционно.

(Для знатоков машинного обучения среди вас мы используем SHAP для выбора функций, как обсуждалось в нашей статье.)

Вы можете задаться вопросом, почему наша служба прогнозирования ограничена тем, что принимает в качестве входных данных только исторические или реальные сделки вашей стратегии и прогнозирует их вероятности получения прибыли. Почему его нельзя использовать напрямую для прогнозирования возврата рынка? Конечно, может: вам нужно только притвориться, что ваша стратегия заключается в покупке и удержании рынка. Он может даже предсказать величину, а не только знак, доходности. Но, как мы все знаем, предсказать движение рынка очень сложно из-за низкого отношения сигнал/шум. Однако ваша собственная стратегия, по-видимому, нашла способ отфильтровать этот шум, и прогнозы машинного обучения, скорее всего, преуспеют в том, чтобы сказать вам, какой режим благоприятен/неблагоприятен для вашей стратегии и с какой вероятностью. Еще одно использование нашего сервиса — использовать его для прогнозирования чисел, которые не подлежат арбитражу, таких вещей, как неожиданный доход компании, изменение кредитного рейтинга или неожиданный размер заработной платы в несельскохозяйственном секторе США (что мы уже успешно сделали). В этих случаях нет противников (ваших коллег-трейдеров), которые изо всех сил стараются обнулить вашу торговую альфу, поэтому эти прогнозы, скорее всего, будут работать в далеком будущем.

(Для знатоков машинного обучения вы можете удивиться, почему мы внедрили только алгоритм обучения случайного леса. Прелесть случайного леса в том, что он прост, но не слишком прост. Сложные алгоритмы глубокого обучения, такие как LSTM, действительно могут учитывать временные ряды. зависимости функций и меток более легко, но они подвергаются серьезному риску отслеживания данных из-за большого количества параметров, которые нужно подогнать.Например, GPT-3, новейший и самый популярный алгоритм глубокого обучения для обработки естественного языка, имеет более 175 млрд параметров. Представьте себе, что это соответствует 1000 исторических сделок!)

Так эта штука действительно работает? Мы внедрили эту систему машинного обучения для нашей Стратегии Tail Reaper в нашем фонде примерно в августе 2019 года. Да, доходность 64% с начала года по состоянию на июнь 2020 года (за вычетом 25% поощрительного вознаграждения!) — это хорошо, но что еще более удивительно. заключается в том, что программа машинного обучения сказала нам не вступать ни в какие сделки (из-за низкой условной вероятности прибыли) с ноября 2019 года по январь 2020 года. Оглядываясь назад, это имело смысл, потому что Tail Reaper — это кризисная альфа-стратегия хеджирования хвоста. Не было ни кризиса, ни хвостового движения, с которого можно было бы пожинать прибыль в те спокойные месяцы.

Но вдруг, начиная с 1 февраля 2020 года, эта программа машинного обучения сказала нам ожидать кризиса. Мы думали, что программа машинного обучения была сумасшедшей — в то время в США было всего несколько случаев Covid-19! Тем не менее, мы последовали его совету и перезапустили Tail Reaper. Позже в том же месяце он принес более 12% прибыли, а остальное уже история. (Прошлые результаты не обязательно указывают на будущие результаты. Подробную информацию об этой стратегии см. на сайте qtscm.com.)

Для читателей, заинтересованных в бесплатной пробной версии или участии в живом веб-семинаре о том, как использовать predictnow.ai для прогнозирования условной вероятности прибыли ваших сделок, зарегистрируйтесь здесь.

Для получения дополнительной информации о нашей работе посетите www.predictnow.ai

Об авторе: Эрни — известный управляющий хедж-фондом и автор статей по количественному финансированию. Ранее он применял свой опыт в области машинного обучения IBM T.J. Группа технологий человеческого языка исследовательского центра Watson, группа интеллектуального анализа данных и искусственного интеллекта Morgan Stanley, а также Horizon Trading Group Credit Suisse.