Я просматривал документацию и тестировал Google Natural Language API и заметил, что некоторые люди, события, организации и местоположения неверны - похоже использовать Википедию в качестве основного источника данных, поэтому, если его нет в Википедии, у него, похоже, возникнут проблемы с определением типа различных слов. Кроме того, если в имени встречаются определенные слова (существительное), это всегда идентифицирует сущность как определенный тип, что не всегда верно.
Например: «Конгресс», кажется, всегда идентифицируется как организация [правительство], даже если он является частью названия мероприятия. Название «WordCamp» отображается как место, но это событие.
Есть ли способ обучить движок естественного языка или предоставить настраиваемый набор организаций, местоположений, событий и т. Д., Чтобы он предоставлял более точную информацию о типах сущностей, которые не пользуются большой популярностью?