Появилась самая востребованная новая функция Kensho NERD: распознавание и устранение неоднозначности людей в финансовых документах.

Новые возможности, новый анализ

До сих пор Kensho NERD в основном фокусировался на поиске компаний и других организаций в заданном тексте. Хотя это невероятно полезно для поиска и анализа, следующим естественным шагом будет поиск других типов сущностей, таких как люди. Финансовые документы, такие как отчеты Комиссии по ценным бумагам и биржам США и отчеты о доходах, содержат важную информацию, ориентированную на людей: изменения в руководстве, объявления совета директоров, вопросы и ответы между аналитиками и докладчиками и многое другое. Отмечая людей и связывая их со структурированными профилями данных в базе данных CapitalIQ S&P Global, NERD открывает новые возможности для обнаружения данных.

Лично мне больше всего нравится думать о НЭРБ, задавая вопросы, на которые он позволяет мне ответить. С NERD для людей мы можем формировать новые запросы, такие как:

  • Какие руководители получают больше всего времени на разговоры о доходах?
  • Какие аналитики охватывают какие компании?
  • Какие аналитики спрашивают об ESG?
  • Кто самый обсуждаемый технический директор?
  • Каково отношение конкретного руководителя к интересующей меня концепции?

Естественно, эту последнюю аналитику стало еще проще определить с помощью Kensho Classify, дочернего проекта NERD, который помечает определяемые пользователем понятия в тексте.

Как мы решили проблему связывания людей

Связывание имен людей, будь то в базах данных или в тексте, с реальным человеком было сложной задачей в области НЛП по двум ключевым причинам:

Во-первых, имена людей принимают множество поверхностных форм. Давайте рассмотрим Тимоти Дональда Кука, нынешнего генерального директора Apple. Или, возможно, вы знаете его как Тима Кука. Хотя в звонках о доходах его часто называют просто Тимом или мистером Куком. Однако для более формальных условий, таких как регистрация в SEC, предпочтение отдается Тимоти Д. Куку. Все эти вариации являются лингвистическими представлениями одного и того же человека, но требуется определенная неоднозначность, чтобы связать все эти разрозненные имена с главой Apple.

Во-вторых, есть много совпадений, когда речь идет как об именах, так и о фамилиях. Со ссылкой на «Тима» мы находим 13 000 потенциальных совпадений в нашей базе знаний профессионалов. Всего 3000 человек с фамилией Кук. А при поиске полного имени «Тим Кук» есть еще 17 вариантов. У нас не всегда есть имя и фамилия при устранении неоднозначности людей, но даже когда мы это делаем, остается много вариантов.

Итак, как мы это сделали? Ответ кроется в одной из ключевых особенностей НЭРД: согласованности. При попытке связать сложное имя, например «Mr. Кук», NERD не просто смотрит на текст имени; NERD использует полный контекст документа, чтобы найти совпадение, которое имеет наибольший смысл с учетом других присутствующих сущностей. Поскольку NERD лучше всех связывает компании и организации, если мы сможем успешно устранить неоднозначность Apple Inc. в документе, то вероятность того, что г-н Кук ссылается на Тима Кука, резко возрастет. Мы выбираем сущности людей, которые лучше всего согласуются с сущностями компании — это значительно сужает круг людей, которых мы рассматриваем как потенциальных партнеров, и позволяет NERD находить нужного человека с невероятно высокой точностью (другими словами, с очень небольшим количеством ложных срабатываний). .

Власть народу

В недавней выборке из 5000 расшифровок звонков о доходах NERD распознал более 22 000 человек. При расширении до нашего полного потока финансовых документов мы ожидаем миллионы новых аннотаций людей, которые можно использовать для улучшения поиска и анализа документов. NERD for People предоставляет пользователям совершенно новую категорию обогащения данных, и она доступна прямо сейчас.

Хотите испытать силу NERD People и расширенные возможности Kensho NERD на себе? Запишитесь на бесплатную пробную версию или поговорите с нами сегодня!