Мутися Ндунда, генеральный директор Alpha Vertex
Часть I нашей серии статей об Альте и использовании альтернативных данных для получения преимущества на рынках.
В то время как количественное инвестирование основано на цифрах, факт заключается в том, что большая часть информации в мире находится в письменной и устной форме, а не закодирована в стерильных числах.
В Alpha Vertex мы рассматриваем это как огромную неиспользованную возможность, и мы создали передовые инструменты обработки естественного языка (NLP) и машинного обучения для извлечения уникальной ценной информации, такой как инвестиционные сигналы, из неструктурированных текстовых наборов данных. с широким охватом.
Наша команда усердно работала над Alta, новой альтернативной службой данных, и мы рады запустить ее на этой неделе.
Все началось с простой идеи. Каждый день в течение сезона отчетности проводится около 300 звонков о доходах, но как бы они ни были важны — и как бы ценны они ни были для раскрытия неиспользованной информации о дальнейшем направлении компании или будущих неудачах — правда в том, что никто не может присутствовать на всех эти заработки звонки.
Alta количественно оценивает информацию, предоставленную компаниями в отчетах о прибылях и убытках, презентациях для инвесторов и объявлениях о продуктах. Набор данных включает в себя более 140 000 материалов телефонных конференций для более чем 7 000 компаний, начиная с 2008 года по настоящее время.
Уникальной особенностью нашего набора данных является то, что стенограммы представлены в формате JSON, что позволяет отделить разные части звонка. Например, можно извлечь подготовленные комментарии генерального директора компании или ответы финансового директора на вопросы аналитиков.
Построенный на наших передовых решениях NLP и машинного обучения, Alta значительно улучшает существующие методы анализа и предоставления неструктурированных наборов данных. Мы предоставляем все необработанные данные в структурированном формате JSON вместе с числовыми характеристиками и индикаторами, которые обобщают и количественно определяют, что и как было сказано. Некоторые из тем, которые систематически отслеживаются и измеряются, включают:
- Что руководители говорят о доходах компании, финансовых перспективах, выкупах и дивидендах
- Обсуждение макроэкономики, клиентов и регуляторных изменений
- Слияние и поглощение
Кроме того, мы отслеживаем всех людей, которые участвовали во время разговора, и сопоставляем их с уникальным идентификатором человека, который остается постоянным, даже когда люди меняют роли или перемещаются между разными фирмами.
Например, Тим Кук, бывший главный операционный директор и нынешний генеральный директор Apple, имеет уникальный идентификатор, который используется для отслеживания его функций НЛП с течением времени и на двух его должностях уровня C в Apple. В том же духе мы можем отслеживать вопросы и ответы, заданные конкретным аналитиком, например Гаем Мошковски, когда он работал в Sandford Bernstein, Merrill Lynch и Autonomous Research.
Alta может сэкономить значительное количество времени портфельным менеджерам и аналитикам, анализируя сложность языка, обобщая тон/настроение, диагностируя личности менеджеров и выделяя ключевые темы.
Необработанные данные и извлеченные функции имеют широкое применение, включая альфа-сигналы в систематических стратегиях, индикаторы раннего предупреждения для риск-менеджеров и инвесторов в облигации, поведенческие индикаторы для фундаментальных инвесторов и инструменты конкурентной разведки для корпораций.
На самом деле, согласно исследованию Колумбийского университета, половина потребителей-покупателей, слушающих или читающих стенограмму телефонного разговора о прибылях и убытках, не владеют ценными бумагами фирмы в то время, когда они это делают. «Мы обнаруживаем, что большая часть институционального потребления [звонков о доходах] на стороне покупателей на самом деле возникает от невладельцев, которые могут рассмотреть возможность [сделать] инвестиции или которые используют звонки для удовлетворения других информационных потребностей», — пишут Хайнрихс, Парк и Солтес.
ОБЗОР ДАННЫХ
Звонки о доходах дают руководителям компаний возможность обсудить свои финансовые показатели и ответить на вопросы аналитиков и инвесторов. Конференц-связь обычно начинается с подготовленных замечаний, за которыми следуют вопросы и ответы. Подготовленные реплики, скорее всего, будут хорошо отрепетированы или даже записаны заранее, но диалоги во время вопросов и ответов, как правило, более естественны и не отрепетированы.
Замечания, сделанные руководителями компании во время этих звонков, служат двум основным целям:
- Информационная: Предоставление информации о финансовом состоянии компании
- Рекламный: управляйте внешним восприятием компании среди инвесторов и аналитиков. Например, Чжоу (2014) показывает, что руководители во время телеконференций играют в игру с обвинением, приписывая успех внутренним факторам, а плохую работу приписывая внешним факторам, таким как погода и экономическая среда.
Наше исследование показывает, что функции обеих частей звонка ценны и обеспечивают плодотворную почву для генерации альфа-канала.
Этот пост состоит из трех частей, через пару дней я углублюсь в технологии и инструменты, используемые для создания Alta.