Обучающие или настраиваемые типы объектов Word?

Я просматривал документацию и тестировал Google Natural Language API и заметил, что некоторые люди, события, организации и местоположения неверны - похоже использовать Википедию в качестве основного источника данных, поэтому, если его нет в Википедии, у него, похоже, возникнут проблемы с определением типа различных слов. Кроме того, если в имени встречаются определенные слова (существительное), это всегда идентифицирует сущность как определенный тип, что не всегда верно.

Например: «Конгресс», кажется, всегда идентифицируется как организация [правительство], даже если он является частью названия мероприятия. Название «WordCamp» отображается как место, но это событие.

Есть ли способ обучить движок естественного языка или предоставить настраиваемый набор организаций, местоположений, событий и т. Д., Чтобы он предоставлял более точную информацию о типах сущностей, которые не пользуются большой популярностью?


person Jim    schedule 21.07.2016    source источник


Ответы (1)


Я являюсь менеджером по продукту. Пользовательские типы сущностей в настоящее время не поддерживаются. Согласно вашему комментарию о неправильном понимании некоторых типов сущностей, это верно для любой системы НЛП, но наша цель - продолжать улучшаться. Мы работаем над тем, чтобы вы могли сообщить нам о случаях, в которых мы ошибаемся, чтобы повысить точность нашей информации, и вскоре поделимся подробностями. Обратите внимание, что мы обучили наши модели на нескольких источниках данных, а не только на данных Википедии. API возвращает наиболее релевантную статью в Википедии для обнаруженного объекта, поэтому, если объект имеет несколько интерпретаций, мы вернем только наиболее часто используемую интерпретацию.

person Apoorv Saxena    schedule 21.07.2016
comment
Спасибо за объяснение - person Jim; 22.07.2016
comment
@ApoorvSaxena - есть ли обновления, касающиеся типов настраиваемых сущностей? - person Kevin P; 09.07.2018