Я новичок в Python и в мире НЛП. Недавнее объявление о Syntaxnet от Google меня заинтриговало. Однако у меня много проблем с пониманием документации как по синтаксису, так и по связанным с ним инструментам (nltk и т. д.).
Моя цель: учитывая входные данные, такие как «Уилбур пнул мяч», я хотел бы извлечь корневой глагол (ударил ногой) и объект, который он относится к «мячу».
Я наткнулся на "spacy.io" и эта визуализация, кажется, инкапсулирует то, что я пытаюсь выполнить: POS пометить строку и загрузить ее в какую-то древовидную структуру, чтобы я мог начать с корневого глагола и пройти по предложению.
Я поиграл с синтаксической сетью/demo.sh и, как было предложено в thread закомментировал последние пару строк, чтобы получить вывод conll.
Затем я загрузил этот ввод в скрипт Python (сам собрался вместе, вероятно, неправильно):
import nltk
from nltk.corpus import ConllCorpusReader
columntypes = ['ignore', 'words', 'ignore', 'ignore', 'pos']
corp = ConllCorpusReader('/Users/dgourlay/development/nlp','input.conll', columntypes)
Я вижу, что у меня есть доступ к corp.tagged_words(), но нет связи между словами. Теперь я застрял! Как я могу загрузить этот корпус в древовидную структуру?
Любая помощь высоко ценится!