Расширение для варианта использования - лемматизация слов NLTK
У меня на компьютере установлен nltk (со всеми модулями и корпусом из книги). Мой вариант использования - изучить и сопоставить некоторые подходы к лемматизации и стеммингу для моего набора данных (я попробовал лемматизацию Портера, которая сработала)
Я пытался использовать лемматизацию с Wordnet, как описано в @Chthonic Project здесь Лемматизация слов NLTK. Однако исходный код, на который он указывает (см. Здесь http://nltk.org/_modules/nltk/app/wordnet_app.html), требуется совместимый модуль от nltk.
from nltk import compat
ImportError: cannot import name compat
Я искал в Google ошибку импорта compat (и это выглядело как совместимость?) И вот что я пробовал на своем ящике ubuntu: -
sudo find. -name compat *, который возвращает файлы, указанные ниже. Я также пробовал sudo find -name "trac" -type d, который ничего не возвращает.
Я вижу, что мне следовало найти несколько модулей с «trac / tests /function / fixes» в аналогичной папке /usr/lib/python2.4/site-packages/Trac-0.11.1-py2.4.egg/trac/ тесты / функциональные /
Вопросы:
1. Что мне не хватает? И это проблема с trac / tests?
2. Есть ли способ использовать wordnet для лемматизации (из nltk.corpus import wordnet, поскольку wn работает нормально. Ошибка импорта решена, как использовать этот модуль http://nltk.org/_modules/nltk/app/wordnet_app.html (я пытался создать источник локально с этой страницы, то есть файл browserver.py, когда я нажимаю ошибку импорта с помощью compat)
Совет: Если вы предоставляете решение, также укажите, как решить эту проблему в моей среде Windows (я использую как окна, так и Ubuntu взаимозаменяемо, в зависимости от контекста)
Файлы, которые я вижу в поиске. -name compat *
ekta@ekta-VirtualBox:/usr/lib/python2.7$ sudo find . -name compat*
./dist-packages/numpy/numarray/compat.pyc
./dist-packages/numpy/numarray/compat.py
./dist-packages/numpy/distutils/compat.pyc
./dist-packages/numpy/distutils/compat.py
./dist-packages/numpy/compat
./dist-packages/numpy/oldnumeric/compat.pyc
./dist-packages/numpy/oldnumeric/compat.py
./dist-packages/twisted/python/compat.pyc
./dist-packages/twisted/python/compat.py
./dist-packages/gtk-2.0/gtk/compat.pyc
./dist-packages/gtk-2.0/gtk/compat.py
Я использую Python 2.7