Вопросы по теме 'pos-tagger'

Извлечение существительного+существительного или (прилагательное|существительное)+существительного из текста
Я хотел бы узнать, возможно ли извлечь существительное + существительное или (прилагательное | существительное) + существительное в пакете R openNLP? То есть я хотел бы использовать лингвистическую фильтрацию для извлечения фраз-кандидатов...
5331 просмотров
schedule 31.07.2023

Как пометить текстовые файлы с помощью hunpos в nltk?
Может ли кто-нибудь помочь мне с синтаксисом для hunpos, помечающего корпус в nltk? Что мне импортировать для модуля hunpos.HunPosTagger ? Как пометить корпус HunPosTag? См. код ниже. import nltk from nltk.corpus import...
1658 просмотров
schedule 26.01.2023

Удалить теги POS-теггера
Можно ли удалить теги из предложений? Это можно сделать, просканировав файл, найдя теги и удалив их, но, поскольку тегов много (у некоторых моделей их 30+, у некоторых около 48-50, они в основном следуют penn treebank pos tags ), is есть ли...
488 просмотров
schedule 18.09.2022

Stanford POS Tagger: как сохранить новые строки в выводе?
Мой файл input.txt содержит следующий образец текста: вы должны давайте приезжать ко мне. Теперь, если я вызову теггер Stanford POS с помощью команды по умолчанию: java -classpath stanford-postagger.jar...
1553 просмотров
schedule 19.07.2022

Часть речевого тегирования: тегирование неизвестных слов
В части речевого теггера наиболее вероятные теги для данного предложения определяются с помощью HMM по P(T*) = argmax P(Word/Tag)*P(Tag/TagPrev) T Но когда слово «Word» не появилось в обучающем корпусе, P (слово / тег) дает...
6737 просмотров
schedule 19.07.2023

использование nltk pos_tag
Я пытаюсь использовать речевые теги в NLTK и использовал эту команду: >>> text = nltk.word_tokenize("And now for something completely different") >>> nltk.pos_tag(text) Traceback (most recent call last): File...
9359 просмотров
schedule 20.04.2022

как создать собственные обучающие данные для парсера opennlp
Я новичок в opennlp, нужна помощь в настройке парсера Я использовал синтаксический анализатор opennlp с предварительно обученной моделью en-pos-maxtent.bin для пометки новых необработанных английских предложений соответствующими частями речи,...
3982 просмотров
schedule 13.03.2023

чтение текстового файла против определенных слов
Я создаю инструмент в Java Eclipse, который будет различать, содержит ли предложение определенное слово или нет. Я использую инструмент twitter4j, чтобы иметь возможность искать твиты в твиттере. Я использовал теггер Стэнфордского НЛП, чтобы...
685 просмотров

POS-Tagger невероятно медленный
Я использую nltk для создания n-грамм из предложений, сначала удаляя заданные стоп-слова. Однако nltk.pos_tag() работает очень медленно, на моем процессоре (Intel i7) занимает до 0,6 секунды. Выход: ['The first time I went, and was...
3372 просмотров
schedule 12.04.2023

Использование универсального набора тегов NLTK с неанглийскими корпусами
Я использую NLTK (3.0.4-1) в Python 3.4.3+, и я хотел бы обработать некоторые помеченные корпуса, используя универсальный набор тегов (который мне пришлось установить), , как описано в книге NLTK, глава 5 . Я могу получить доступ к любому из этих...
2062 просмотров
schedule 11.04.2023

Определение тегов POS и наборов меток зависимостей используются в Parsey McParseface?
Теги POS и метки Depedency, выводимые Parsey McParseface , приведены в файлах tag-set и label-set здесь соответственно. В Syntaxnet файле ознакомительных сведений указано, что модель была обучена на Penn Treebank, OntoNotes и English Web...
926 просмотров

В R: Как решить ошибку «Недостаточно памяти» в POS-теггере?
В R у меня есть данные с 30 записями для выборки, основные данные имеют 20000 записей. записи — это твиты. Я извлекаю биграммы из любого твита и использую из постаггера. Для примера данных, которые показали мне ошибки...
2727 просмотров

Извлечение национальностей и стран из текста
Я хочу извлечь все упоминания страны и национальности из текста с помощью nltk. Я использовал теги POS для извлечения всех токенов с меткой GPE, но результаты меня не удовлетворили. abstract="Thyroid-associated orbitopathy (TO) is an...
9117 просмотров
schedule 01.07.2023

Использование тегов Syntaxnet POS в python?
Я хочу использовать теги синтаксического анализатора (например: VBD ROOT, NN nsubj и т. д.) синтаксической сети в python, чтобы помочь создать чат-бота. Ввод осуществляется в консоли. Вопрос: Как получить в переменной результат только VBP ROOT и...
1213 просмотров

Как использовать Keras для создания тега части речи?
Я пытаюсь реализовать метку части речи, используя нейронную сеть с помощью Keras. Я использую последовательную модель и данные обучения из Penn Treebank Corpus NLTK (т.е. из nltk.corpus import treebank). Насколько я понимаю, формирование нейронной...
3304 просмотров

объясняя уродливые ошибки NLTK pos_tag
Я занимаюсь анализом текста с помощью Python3-NLTK. На этапе предварительной обработки я хотел реализовать разбиение на фрагменты имен-фраз, для чего требуется маркировка POS и выбор в соответствии с регулярное выражение (грамматика) . Мои...
83 просмотров
schedule 15.07.2022

Теги POS на уровне Word в Python
Я пытаюсь сделать тег pos для каждого слова в каждой строке (каждая строка содержит несколько предложений). У меня есть этот код: import nltk import pos_tag import nltk.tokenize import word_tokenize f = open('C:\Users\test_data.txt') data =...
596 просмотров
schedule 09.06.2023

Создание и использование тегированных корпусов с помощью NLTK
Я пытаюсь создать корпус с тегами на малагасийском (мой родной язык). Я следовал инструкциям в документе Обработка текста Python и обработка естественного языка , а также на странице https://www.nltk.org/book/ch05.html . Мне удалось создать...
236 просмотров
schedule 09.06.2022

Маркировка R POS и токенизация за один раз
У меня есть текст, как показано ниже. Section <- c("If an infusion reaction occurs, interrupt the infusion.") df <- data.frame(Section) Когда я токенизирую с помощью tidytext и приведенного ниже кода, AA <- df %>%...
1720 просмотров
schedule 11.10.2022

Python: тег pos — со словом «назад»
Как отличить почтовый тег back в следующих предложениях: испытывает прерывистую стреляющую боль в пояснице после столкновения где-то в затылке Примеры из космоса doc = nlp(u'experiencing intermittent shooting pain in her lower back...
69 просмотров
schedule 16.07.2023