Достижение 99% точности с распознаванием сущностей

Одна из наших основных технических целей в Zoom.ai — убедиться, что наш автоматизированный помощник отлично понимает наших пользователей, когда они взаимодействуют через чат или электронную почту. Для этого нам нужно подтвердить, что наша технология очень хорошо распознает сущности и намерения.

Сущности — это фрагменты информации, которые придают контекст намерению запроса. Например, в предложении «Назначить встречу с Андре где-то в последние две недели марта» смысл предложения состоит в том, чтобы запланировать встречу, и, чтобы сделать намерение более ясным, включены две сущности: 1) Andre, что является именем человека, и 2) где-то в последние две недели марта, что соответствует промежутку времени.

Именно эта динамическая неограниченная природа этих сущностей заставила нас создать нашу собственную базовую технологию извлечения сущностей НЛП вместо использования готовых решений.

В течение последнего года мы внимательно изучали взаимодействие наших пользователей, и это привело к тому, что мы недавно запустили новый алгоритм распознавания объектов, который позволяет Zoom.ai распознавать объекты с точностью более 97%. Мы также теперь поддерживаем больше типов сущностей, таких как тема, команды, должности, а также наши ранее известные типы сущностей, такие как даты, люди и местоположения.

Для получения такой высокой точности новый алгоритм учитывает семантическую и синтаксическую структуру запросов, а также порядок появления слов друг за другом. По сути, мы сделали более сбалансированный акцент на использовании грамматической структуры предложений, эффективно обходя граф зависимостей.

Кроме того, поскольку основная цель наших решений для обработки естественного языка — предоставить нашим пользователям возможность максимально беспрепятственно взаимодействовать с Zoom.ai, мы позаботились о том, чтобы возможности наших моделей не ограничивались грамматически правильным использованием языка.

Имея точность в качестве основной цели, мы во вторую очередь сосредоточились на расширяемости алгоритма распознавания сущностей. Это важно, потому что, поскольку мы позволяем нашим пользователям выполнять все больше и больше задач с помощью своего автоматизированного помощника, нам нужно распознавать все больше и больше типов сущностей. И мы сделали это возможным, полагаясь на синтаксические и семантические структуры языка и, таким образом, требуя минимального обучающего набора для каждого типа объекта.

Кроме того, поскольку у нас есть доступ к практически бесконечному количеству обучающих данных для каждого языка, по мере повышения точности наших языковых моделей точность нашего алгоритма распознавания сущностей будет улучшаться без дополнительных ручных усилий.

Следующим шагом в линейке наших технологий обработки естественного языка является включение распознавания намерений в процесс распознавания сущностей, следовательно, использование синтаксических и семантических структур языка и, в то же время, возможность одного обхода. графа зависимостей для выполнения обеих задач.

Достижение 99% точности с распознаванием сущностей

Вопросы по теме