Вопросы по теме 'pos-tagger'
Извлечение существительного+существительного или (прилагательное|существительное)+существительного из текста
Я хотел бы узнать, возможно ли извлечь существительное + существительное или (прилагательное | существительное) + существительное в пакете R openNLP? То есть я хотел бы использовать лингвистическую фильтрацию для извлечения фраз-кандидатов...
5331 просмотров
schedule
31.07.2023
Как пометить текстовые файлы с помощью hunpos в nltk?
Может ли кто-нибудь помочь мне с синтаксисом для hunpos, помечающего корпус в nltk?
Что мне импортировать для модуля hunpos.HunPosTagger ?
Как пометить корпус HunPosTag? См. код ниже.
import nltk
from nltk.corpus import...
1658 просмотров
schedule
26.01.2023
Удалить теги POS-теггера
Можно ли удалить теги из предложений? Это можно сделать, просканировав файл, найдя теги и удалив их, но, поскольку тегов много (у некоторых моделей их 30+, у некоторых около 48-50, они в основном следуют penn treebank pos tags ), is есть ли...
488 просмотров
schedule
18.09.2022
Stanford POS Tagger: как сохранить новые строки в выводе?
Мой файл input.txt содержит следующий образец текста:
вы должны давайте приезжать ко мне.
Теперь, если я вызову теггер Stanford POS с помощью команды по умолчанию:
java -classpath stanford-postagger.jar...
1553 просмотров
schedule
19.07.2022
Часть речевого тегирования: тегирование неизвестных слов
В части речевого теггера наиболее вероятные теги для данного предложения определяются с помощью HMM по
P(T*) = argmax P(Word/Tag)*P(Tag/TagPrev)
T
Но когда слово «Word» не появилось в обучающем корпусе, P (слово / тег) дает...
6737 просмотров
schedule
19.07.2023
использование nltk pos_tag
Я пытаюсь использовать речевые теги в NLTK и использовал эту команду:
>>> text = nltk.word_tokenize("And now for something completely different")
>>> nltk.pos_tag(text)
Traceback (most recent call last):
File...
9359 просмотров
schedule
20.04.2022
как создать собственные обучающие данные для парсера opennlp
Я новичок в opennlp, нужна помощь в настройке парсера
Я использовал синтаксический анализатор opennlp с предварительно обученной моделью en-pos-maxtent.bin для пометки новых необработанных английских предложений соответствующими частями речи,...
3982 просмотров
schedule
13.03.2023
чтение текстового файла против определенных слов
Я создаю инструмент в Java Eclipse, который будет различать, содержит ли предложение определенное слово или нет.
Я использую инструмент twitter4j, чтобы иметь возможность искать твиты в твиттере.
Я использовал теггер Стэнфордского НЛП, чтобы...
685 просмотров
schedule
07.09.2022
POS-Tagger невероятно медленный
Я использую nltk для создания n-грамм из предложений, сначала удаляя заданные стоп-слова. Однако nltk.pos_tag() работает очень медленно, на моем процессоре (Intel i7) занимает до 0,6 секунды.
Выход:
['The first time I went, and was...
3372 просмотров
schedule
12.04.2023
Использование универсального набора тегов NLTK с неанглийскими корпусами
Я использую NLTK (3.0.4-1) в Python 3.4.3+, и я хотел бы обработать некоторые помеченные корпуса, используя универсальный набор тегов (который мне пришлось установить), , как описано в книге NLTK, глава 5 .
Я могу получить доступ к любому из этих...
2062 просмотров
schedule
11.04.2023
Определение тегов POS и наборов меток зависимостей используются в Parsey McParseface?
Теги POS и метки Depedency, выводимые Parsey McParseface , приведены в файлах tag-set и label-set здесь соответственно.
В Syntaxnet файле ознакомительных сведений указано, что модель была обучена на Penn Treebank, OntoNotes и English Web...
926 просмотров
schedule
06.04.2024
В R: Как решить ошибку «Недостаточно памяти» в POS-теггере?
В R у меня есть данные с 30 записями для выборки, основные данные имеют 20000 записей. записи — это твиты. Я извлекаю биграммы из любого твита и использую из постаггера. Для примера данных, которые показали мне ошибки...
2727 просмотров
schedule
25.08.2022
Извлечение национальностей и стран из текста
Я хочу извлечь все упоминания страны и национальности из текста с помощью nltk. Я использовал теги POS для извлечения всех токенов с меткой GPE, но результаты меня не удовлетворили.
abstract="Thyroid-associated orbitopathy (TO) is an...
9117 просмотров
schedule
01.07.2023
Использование тегов Syntaxnet POS в python?
Я хочу использовать теги синтаксического анализатора (например: VBD ROOT, NN nsubj и т. д.) синтаксической сети в python, чтобы помочь создать чат-бота. Ввод осуществляется в консоли.
Вопрос: Как получить в переменной результат только VBP ROOT и...
1213 просмотров
schedule
12.07.2022
Как использовать Keras для создания тега части речи?
Я пытаюсь реализовать метку части речи, используя нейронную сеть с помощью Keras.
Я использую последовательную модель и данные обучения из Penn Treebank Corpus NLTK (т.е. из nltk.corpus import treebank). Насколько я понимаю, формирование нейронной...
3304 просмотров
schedule
01.02.2023
объясняя уродливые ошибки NLTK pos_tag
Я занимаюсь анализом текста с помощью Python3-NLTK. На этапе предварительной обработки я хотел реализовать разбиение на фрагменты имен-фраз, для чего требуется маркировка POS и выбор в соответствии с регулярное выражение (грамматика) . Мои...
83 просмотров
schedule
15.07.2022
Теги POS на уровне Word в Python
Я пытаюсь сделать тег pos для каждого слова в каждой строке (каждая строка содержит несколько предложений).
У меня есть этот код:
import nltk import pos_tag
import nltk.tokenize import word_tokenize
f = open('C:\Users\test_data.txt')
data =...
596 просмотров
schedule
09.06.2023
Создание и использование тегированных корпусов с помощью NLTK
Я пытаюсь создать корпус с тегами на малагасийском (мой родной язык). Я следовал инструкциям в документе Обработка текста Python и обработка естественного языка , а также на странице https://www.nltk.org/book/ch05.html . Мне удалось создать...
236 просмотров
schedule
09.06.2022
Маркировка R POS и токенизация за один раз
У меня есть текст, как показано ниже.
Section <- c("If an infusion reaction occurs, interrupt the infusion.")
df <- data.frame(Section)
Когда я токенизирую с помощью tidytext и приведенного ниже кода,
AA <- df %>%...
1720 просмотров
schedule
11.10.2022
Python: тег pos — со словом «назад»
Как отличить почтовый тег back в следующих предложениях:
испытывает прерывистую стреляющую боль в пояснице после столкновения
где-то в затылке
Примеры из космоса
doc = nlp(u'experiencing intermittent shooting pain in her lower back...
69 просмотров
schedule
16.07.2023