Мутися Ндунда, генеральный директор Alpha Vertex

Часть I нашей серии статей об Альте и использовании альтернативных данных для получения преимущества на рынках.

В то время как количественное инвестирование основано на цифрах, факт заключается в том, что большая часть информации в мире находится в письменной и устной форме, а не закодирована в стерильных числах.

В Alpha Vertex мы рассматриваем это как огромную неиспользованную возможность, и мы создали передовые инструменты обработки естественного языка (NLP) и машинного обучения для извлечения уникальной ценной информации, такой как инвестиционные сигналы, из неструктурированных текстовых наборов данных. с широким охватом.

Наша команда усердно работала над Alta, новой альтернативной службой данных, и мы рады запустить ее на этой неделе.

Все началось с простой идеи. Каждый день в течение сезона отчетности проводится около 300 звонков о доходах, но как бы они ни были важны — и как бы ценны они ни были для раскрытия неиспользованной информации о дальнейшем направлении компании или будущих неудачах — правда в том, что никто не может присутствовать на всех эти заработки звонки.

Alta количественно оценивает информацию, предоставленную компаниями в отчетах о прибылях и убытках, презентациях для инвесторов и объявлениях о продуктах. Набор данных включает в себя более 140 000 материалов телефонных конференций для более чем 7 000 компаний, начиная с 2008 года по настоящее время.

Уникальной особенностью нашего набора данных является то, что стенограммы представлены в формате JSON, что позволяет отделить разные части звонка. Например, можно извлечь подготовленные комментарии генерального директора компании или ответы финансового директора на вопросы аналитиков.

Построенный на наших передовых решениях NLP и машинного обучения, Alta значительно улучшает существующие методы анализа и предоставления неструктурированных наборов данных. Мы предоставляем все необработанные данные в структурированном формате JSON вместе с числовыми характеристиками и индикаторами, которые обобщают и количественно определяют, что и как было сказано. Некоторые из тем, которые систематически отслеживаются и измеряются, включают:

  • Что руководители говорят о доходах компании, финансовых перспективах, выкупах и дивидендах
  • Обсуждение макроэкономики, клиентов и регуляторных изменений
  • Слияние и поглощение

Кроме того, мы отслеживаем всех людей, которые участвовали во время разговора, и сопоставляем их с уникальным идентификатором человека, который остается постоянным, даже когда люди меняют роли или перемещаются между разными фирмами.

Например, Тим Кук, бывший главный операционный директор и нынешний генеральный директор Apple, имеет уникальный идентификатор, который используется для отслеживания его функций НЛП с течением времени и на двух его должностях уровня C в Apple. В том же духе мы можем отслеживать вопросы и ответы, заданные конкретным аналитиком, например Гаем Мошковски, когда он работал в Sandford Bernstein, Merrill Lynch и Autonomous Research.

Alta может сэкономить значительное количество времени портфельным менеджерам и аналитикам, анализируя сложность языка, обобщая тон/настроение, диагностируя личности менеджеров и выделяя ключевые темы.

Необработанные данные и извлеченные функции имеют широкое применение, включая альфа-сигналы в систематических стратегиях, индикаторы раннего предупреждения для риск-менеджеров и инвесторов в облигации, поведенческие индикаторы для фундаментальных инвесторов и инструменты конкурентной разведки для корпораций.

На самом деле, согласно исследованию Колумбийского университета, половина потребителей-покупателей, слушающих или читающих стенограмму телефонного разговора о прибылях и убытках, не владеют ценными бумагами фирмы в то время, когда они это делают. «Мы обнаруживаем, что большая часть институционального потребления [звонков о доходах] на стороне покупателей на самом деле возникает от невладельцев, которые могут рассмотреть возможность [сделать] инвестиции или которые используют звонки для удовлетворения других информационных потребностей», — пишут Хайнрихс, Парк и Солтес.

ОБЗОР ДАННЫХ

Звонки о доходах дают руководителям компаний возможность обсудить свои финансовые показатели и ответить на вопросы аналитиков и инвесторов. Конференц-связь обычно начинается с подготовленных замечаний, за которыми следуют вопросы и ответы. Подготовленные реплики, скорее всего, будут хорошо отрепетированы или даже записаны заранее, но диалоги во время вопросов и ответов, как правило, более естественны и не отрепетированы.

Замечания, сделанные руководителями компании во время этих звонков, служат двум основным целям:

  • Информационная: Предоставление информации о финансовом состоянии компании
  • Рекламный: управляйте внешним восприятием компании среди инвесторов и аналитиков. Например, Чжоу (2014) показывает, что руководители во время телеконференций играют в игру с обвинением, приписывая успех внутренним факторам, а плохую работу приписывая внешним факторам, таким как погода и экономическая среда.

Наше исследование показывает, что функции обеих частей звонка ценны и обеспечивают плодотворную почву для генерации альфа-канала.

Этот пост состоит из трех частей, через пару дней я углублюсь в технологии и инструменты, используемые для создания Alta.