Ученые OG Data: LTCM и Возрождение

Все модели неправильные, но некоторые полезны. - Джордж Бокс

Кремниевая долина может многому научиться у специалистов по данным, которые пришли за десятилетия до того, как в технологической индустрии появился термин «наука о данных». Есть несколько особенно ценных уроков, которые извлекли две компании, занимающиеся количественным инвестированием, обе известные, но по разным причинам: «Ренессанс Капитал» и «Долгосрочное управление капиталом» («LTCM»). С момента запуска своего флагманского фонда в 1988 году Renaissance добился среднегодовой прибыли в 39% за более чем 30 лет и сегодня стабильно растет. Выберите известных инвесторов - Berkshire Hathaway, Bridgewater, Blackstone - Renaissance превосходит всех их с большим отрывом. Прибыль LTCM была еще более впечатляющей - среднегодовая доходность 100% в период с 1994 по 1998 год. Затем она потеряла почти всю свою стоимость за два месяца, обанкротилась и почти уничтожила всю финансовую систему США.

Мой взгляд на эти компании основан на двух книгах: Когда гений потерпел поражение, Человек, решивший рынок, описанный Грегори Цукерманом, Ренессанс и его основатель Джим Саймонс. Оба являются тщательно проработанными произведениями научно-популярной литературы, которые читаются как романы. Ренессанс известен своей секретностью, и книга Цукермана проливает лишь небольшой свет на настоящие инвестиционные стратегии фирмы. Тем не менее, меня в основном интересуют эти компании с точки зрения продукта, и между Renaissance и LTCM существует множество разительных продуктовых контрастов. Эти контрасты особенно актуальны для компаний FinTech ( как компания, в которой я работаю, Opendoor), но они также актуальны для любой компании, которая принимает решения или рекомендации на основе алгоритмов ... практически для каждой технологической компании.

Почему эти компании по сути своей являются компаниями по обработке и анализу данных? Во-первых, оба они занимались моделями. Эти модели должны были быть очень точными и надежными в производстве - на них ежедневно уходили миллиарды долларов. Во-вторых, их культура привлекала и подчеркивала необходимость принятия строгих математических и статистических решений, чему многие технологические компании пытаются подражать. Среди основателей LTCM были лауреаты Нобелевской премии Роберт Мертон и Майрон Скоулз (изобретатель уравнения Блэка-Шоулза), в то время как основатель Renaissance Саймонс был пионером в геометрической топологии, прежде чем покинуть академические круги.

Краткосрочные прогнозы лучше долгосрочных

С точки зрения продукта, первое очевидное различие между Renaissance и LTCM заключается в том, что они совершали разные типы сделок, которые имели очень разную продолжительность. LTCM в основном торговался парами государственных облигаций (например, длинная позиция по немецким облигациям и короткая по итальянским облигациям, также известная как конвергентная сделка). Эти сделки занимают несколько месяцев, поэтому они требуют точных прогнозов на период в несколько месяцев. Renaissance, с другой стороны, держал свои торги всего несколько дней (а иногда и часов), требуя только однодневных прогнозов.

Чем короче, тем лучше, потому что это означает больше исторических примеров, на которых можно учиться. Попробуйте определить модели цен на акции на основе данных за 100 лет. Чтобы делать прогнозы на год, есть только 100 неперекрывающихся примеров, на которых можно поучиться. Чтобы сделать прогноз на 1 день, существует 36 500 неперекрывающихся экземпляров. Другими словами, более короткий период прогнозирования означает более эффективных обучающих данных при прочих равных условиях для моделирования временных рядов.

Более короткий период прогноза также позволил Renaissance быстро определить, когда его модели сбивались с пути в реальном мире. Один из самых опасных способов выхода модели из строя - это хорошие результаты при тестировании на истории и плохие результаты в производстве. Компания Renaissance заметила, что модель, проверенная на исторических данных, дает сбой в реальном мире в течение 1-2 дней. В первые годы существования у него было много таких неудач, но, поскольку они были обнаружены быстро, потери от каждого были относительно небольшими.

Для LTCM потребовалось несколько месяцев, чтобы обнаружить, когда его модели не ведут себя в реальном мире, как при тестировании на исторических данных. Когда они впервые заметили серьезную неисправность модели, было уже слишком поздно; они накопили много месяцев плохого риска, и фирма уже катилась к банкротству.

Преднамеренный рост

Renaissance необычен тем, насколько мало он увеличил линейку продуктов по сравнению с финансовым успехом. Возрождение началось с торговли товарами и валютой, где к середине 1980-х гг. Научилось приносить устойчивую, но относительно небольшую прибыль. Для роста ей необходимо было выйти на более крупный рынок: акции. Renaissance тестировал алгоритмы торговли акциями почти десять лет, обнаруживая множество алгоритмов, которые успешно прошли тестирование на исторических данных, но потерпели неудачу в реальном мире.

Снова и снова он опускал палец ноги в воду и отступал. По мере нарастания разочарования некоторые из лучших сотрудников фирмы ушли - некоторые считали, что Renaissance слишком осторожно относится к акциям, в то время как другие полагали, что с акциями невозможно решить проблему. Но основная группа ученых продолжала настаивать. Наконец они нашли алгоритм, который работал в реальном мире. Это было результатом сотен дополнительных настроек и исправлений ошибок, а не единственной «эврики». Renaissance медленно масштабировал этот алгоритм акций в течение многих лет.

Но, несмотря на масштабирование своего бизнеса с акциями, потребовались уравновешивающие меры для сдерживания роста. В 2003 году Саймонс пришел к выводу, что Renaissance рискует управлять большим количеством денег, чем его модель могла уверенно распределить, поэтому фирма прекратила привлекать капитал внешних инвесторов, и с тех пор решение не изменилось.

LTCM, с другой стороны, росла как лесной пожар. Первоначально он был сосредоточен на сделках по конвергенции суверенного долга, но другие компании заметили его успех и начали копировать его сделки. В течение 24 месяцев после основания LTCM наплыв конкуренции сделал пространство менее прибыльным, и LTCM начал искать другие направления. Фирма начала активно инвестировать в акционерные компании двойного класса и арбитраж слияний, классы активов радикально отличные от облигаций. Для посторонних и средств массовой информации это было объявлено признаком успеха. Но на самом деле LTCM не смогла продемонстрировать устойчивую прибыльность своего основного продукта и перешла на новые, еще менее проверенные продукты.

Для продукта прогнозирования временных рядов лучший способ убедиться, что успех реален, а не просто удача, - это продемонстрировать реальную точность в течение длительного периода. Ренессанс это понимал; LTCM этого не сделал.

Никогда не доверяйте интуиции модели. И никогда полностью не доверяйте модели.

Когда была основана LTCM, она фокусировалась на одном продукте: конвергентных сделках по суверенному долгу, основанным на алгоритмах. Фирма глубоко верила в силу своего оригинального алгоритма; он был основан на работе двух основателей, получивших Нобелевскую премию, и имел невероятный послужной список. Неважно, что этот послужной список был коротким и основывался на достаточно небольшом количестве результатов (из-за долгосрочного характера сделок), поэтому его нельзя было отличить от удачной полосы. Фирма полностью доверилась своей модели.

Однако переход от сделок конвергенции к арбитражу слияний и акционерным компаниям двойного класса заставил LTCM больше полагаться на интуицию своих партнеров. Конечно, LTCM построила модели для этих новых продуктов. Но не было модели для распределения риска по разным продуктам (классам активов); это было сделано комитетом. В конечном итоге распределение рисков отражало убеждения и внутреннюю политику членов комитета. Глава лондонского офиса LTCM приобрел влияние в фирме и приобрел энтузиазм по поводу конкретной сделки с Royal Dutch Shell, поэтому LTCM вложил в нее более двух миллиардов долларов, несмотря на высокую концентрацию рисков и отсутствие успеха с этим новым продуктом.

В Renaissance Джима Саймонса неоднократно сжигали в начале его инвестиционной деятельности, когда он игнорировал алгоритмические рекомендации. Он узнал, что может и должен определить, когда модель была серьезно нарушена, прекратить торговать по ее рекомендациям и исправить это. Но он также узнал, что, если в целом ему не нравились решения модели - но в решениях модели не было очевидной ошибки, - его интуиция не приводила к лучшим результатам. В Renaissance стало частью культуры, что можно было выключить модель, отладить ее и снова включить, но было недопустимо отменять рекомендацию модели; любое обоснование отмены решения должно было либо быть встроено в саму модель, либо отвергнуто.

Renaissance также выиграл от наличия монолитной модели, которая принимала на себя все решения для флагманского фонда фирмы. Монолитная кодовая база стала ругательством в разработке программного обеспечения, но у нее было интересное преимущество для Renaissance: она заставляла алгоритмически управлять компромиссами при распределении между продуктами. Это отличается от гибрида человека и машины в LTCM, где модели выбирали активы, но комитет решил, как распределить риск по классам активов.

Дифференцированные данные

Последним товарным фактором, разделившим Renaissance и LTCM, была ориентация Renaissance на дифференцированные данные. Renaissance был запущен с упором на довольно банальный тип данных: дневные цены закрытия товаров и валют. Это были данные, которые использовали и все остальные трейдеры. Но компания Renaissance осознала, что дифференцированные данные означают не только разные типы данных: они также означают более высокое качество и более высокий охват того же типа данных, что и у его конкурентов.

На самом деле, сосредоточение внимания на том же типе данных, что и у его конкурентов, имело большой смысл. Тот факт, что все другие торговые фирмы оценили этот тип данных, свидетельствует о том, что этот тип данных является сильным сигналом. И часто бывает проще усилить известный ценный сигнал, чем найти совершенно новый сигнал. Renaissance усилил сигнал, собирая ежедневные данные о ценах на несколько лет раньше, чем его конкуренты, объединяя данные из большего числа источников, а также очищая и перекрестно проверяя данные для удаления ошибочных значений.

По мере роста фирмы у нее появлялись новые типы данных: от ежедневных цен закрытия до внутридневных цен, от финансовых показателей компании до бесплатных текстовых новостей ... Держу пари, что Renaissance теперь использует социальные сети, изображения и видео, но я м гадаю.

Оглядываясь назад, можно легко сопоставить, где Renaissance выглядит хорошо, а LTCM - плохо. По правде говоря, Возрождение далеко не безупречно - в нем есть немало странных и тревожных эпизодов. И у LTCM действительно было несколько глубоко инновационных и ценных идей, которые были незаметно приняты другими фирмами после его упадка.

Реальный мир сложен, но есть последний простой урок, который применим даже к стартапам, не имеющим ничего общего с финансами или алгоритмами: прибейте свой основной продукт до масштабирования. И не путайте похвалы прессы, инвесторов или даже клиентов со способностью получать стабильную прибыль. В конце концов, это то, что в конечном итоге позволяет вам управлять своей судьбой.

Ученые OG Data: LTCM и Возрождение

Краткосрочные прогнозы лучше долгосрочных

Преднамеренный рост

Никогда не доверяйте интуиции модели. И никогда полностью не доверяйте модели.

Дифференцированные данные

Вопросы по теме