Вы, должно быть, уже нашли свой ответ, но для всех, кто может наткнуться на этот пост о Морфе:
вы можете загрузить Morpha прямо с: http://www.informatics.susx.ac.uk/research/groups/nlp/carroll/morph.html
Но для этого сначала необходимо установить, распаковать и скомпилировать flex (я использую командную строку терминала Linux ниже):
tar -xzf flex-for-morph.tar.gz
Затем измените текущий рабочий каталог на flex и сделайте его:
./configure
make
Если команда make выдает следующую ошибку:
make: yacc: Команда не найдена Makefile: 105: рецепт для цели 'parse.c' не удалось сделать: *** [parse.c] Ошибка 127
это означает, что он не может получить yacc; поэтому вам нужно установить bison через командную строку:
sudo apt-get install bison
Теперь снова запустите команду make, она должна дать вам что-то похожее на это в последней строке:
gcc -g -O -o flex ccl.o dfa.o ecs.o gen.o main.o misc.o nfa.o parse.o scan.o skel.o sym.o tblcmp.o yylex.o libfl.a
Теперь вы можете скомпилировать Morpha (которую вы скачали по ссылке выше):
../flex-2.5.4/flex -i -Cfe -8 -omorpha.yy.c morpha.lex
gcc -o morpha morpha.yy.c
Морфа берет в качестве входных данных файлы, уже помеченные POS-тегами. Чтобы лемматизировать один файл, используйте:
./morpha -t < ~/path to your file/yourfile.tag
указанная выше опция -t печатает теги POS также вместе с лемматизированными формами; чтобы использовать параметр, чувствительный к регистру, используйте -c, а для обоих параметров вместе используйте -ct
Надеюсь, поможет!
person
Maryam Nasseri
schedule
22.01.2019