Python: тег pos — со словом «назад»

Как отличить почтовый тег back в следующих предложениях:

  1. испытывает прерывистую стреляющую боль в пояснице после столкновения
  2. где-то в затылке

Примеры из космоса

doc = nlp(u'experiencing intermittent shooting pain in her lower back following the collision')

for token in doc:
    print(token.text, token.pos_, token.tag_, token.dep_)

#experiencing VERB VBG ROOT
#intermittent ADJ JJ amod
#shooting NOUN NN compound
#pain NOUN NN dobj
#in ADP IN prep
#her ADJ PRP$ poss
#lower ADJ JJR advmod
#back ADV RB pobj
#following VERB VBG prep
#the DET DT det
#collision NOUN NN pobj

doc = nlp(u'somewhere in the back of my head')

for token in doc:
    print(token.text, token.pos_, token.tag_, token.dep_)

#somewhere ADV RB ROOT
#in ADP IN prep
#the DET DT det
#back NOUN NN pobj
#of ADP IN prep
#my ADJ PRP$ poss
#head NOUN NN pobj

Интуитивно, «назад» в 1 — это СУЩЕСТВИТЕЛЬНОЕ, а 2 — это НАЧАЛО?? Извлекая СУЩЕСТВИТЕЛЬНОЕ из приведенных выше предложений, я ожидал, что «спина» в «ее нижней части спины» будет извлечена. Итак, как это сделать?

Кроме того, я запутался с результатами тегирования постов, как узнать, правильно ли работает тегирование постов?


person Lisa    schedule 25.02.2019    source источник


Ответы (1)


результаты пост-тегов могут сбивать с толку.

Одна вещь, которая может помочь вам брать фрагменты существительных. Или создайте правила для получения пользовательских фрагментов: обычно триграммы и биграммы идентифицированных pos-тегов формируют ваши данные, а затем используйте pos-теги этих фрагментов для маркировки слов в фрагменте.

person hawk    schedule 30.09.2019