Публикации по теме pos-tagger [r, nlp, pos-tagger, opennlp, python]

Вопросы по теме 'pos-tagger'

Извлечение существительного+существительного или (прилагательное|существительное)+существительного из текста

Я хотел бы узнать, возможно ли извлечь существительное + существительное или (прилагательное | существительное) + существительное в пакете R openNLP? То есть я хотел бы использовать лингвистическую фильтрацию для извлечения фраз-кандидатов...

5331 просмотров

r nlp pos-tagger opennlp

31.07.2023

Как пометить текстовые файлы с помощью hunpos в nltk?

Может ли кто-нибудь помочь мне с синтаксисом для hunpos, помечающего корпус в nltk? Что мне импортировать для модуля hunpos.HunPosTagger ? Как пометить корпус HunPosTag? См. код ниже. import nltk from nltk.corpus import...

1658 просмотров

python nltk corpus pos-tagger

26.01.2023

Удалить теги POS-теггера

Можно ли удалить теги из предложений? Это можно сделать, просканировав файл, найдя теги и удалив их, но, поскольку тегов много (у некоторых моделей их 30+, у некоторых около 48-50, они в основном следуют penn treebank pos tags ), is есть ли...

488 просмотров

java stanford-nlp pos-tagger

18.09.2022

Stanford POS Tagger: как сохранить новые строки в выводе?

Мой файл input.txt содержит следующий образец текста: вы должны давайте приезжать ко мне. Теперь, если я вызову теггер Stanford POS с помощью команды по умолчанию: java -classpath stanford-postagger.jar...

1553 просмотров

java text nlp stanford-nlp pos-tagger

19.07.2022

Часть речевого тегирования: тегирование неизвестных слов

В части речевого теггера наиболее вероятные теги для данного предложения определяются с помощью HMM по P(T*) = argmax P(Word/Tag)*P(Tag/TagPrev) T Но когда слово «Word» не появилось в обучающем корпусе, P (слово / тег) дает...

6737 просмотров

nlp pos-tagger oov

19.07.2023

использование nltk pos_tag

Я пытаюсь использовать речевые теги в NLTK и использовал эту команду: >>> text = nltk.word_tokenize("And now for something completely different") >>> nltk.pos_tag(text) Traceback (most recent call last): File...

9359 просмотров

nltk pos-tagger

20.04.2022

как создать собственные обучающие данные для парсера opennlp

Я новичок в opennlp, нужна помощь в настройке парсера Я использовал синтаксический анализатор opennlp с предварительно обученной моделью en-pos-maxtent.bin для пометки новых необработанных английских предложений соответствующими частями речи,...

3982 просмотров

pos-tagger opennlp

13.03.2023

чтение текстового файла против определенных слов

Я создаю инструмент в Java Eclipse, который будет различать, содержит ли предложение определенное слово или нет. Я использую инструмент twitter4j, чтобы иметь возможность искать твиты в твиттере. Я использовал теггер Стэнфордского НЛП, чтобы...

685 просмотров

java twitter text-files stanford-nlp pos-tagger

07.09.2022

POS-Tagger невероятно медленный

Я использую nltk для создания n-грамм из предложений, сначала удаляя заданные стоп-слова. Однако nltk.pos_tag() работает очень медленно, на моем процессоре (Intel i7) занимает до 0,6 секунды. Выход: ['The first time I went, and was...

3372 просмотров

python nlp nltk pos-tagger

12.04.2023

Использование универсального набора тегов NLTK с неанглийскими корпусами

Я использую NLTK (3.0.4-1) в Python 3.4.3+, и я хотел бы обработать некоторые помеченные корпуса, используя универсальный набор тегов (который мне пришлось установить), , как описано в книге NLTK, глава 5 . Я могу получить доступ к любому из этих...

2062 просмотров

python-3.x python nlp nltk pos-tagger

11.04.2023

Определение тегов POS и наборов меток зависимостей используются в Parsey McParseface?

Теги POS и метки Depedency, выводимые Parsey McParseface , приведены в файлах tag-set и label-set здесь соответственно. В Syntaxnet файле ознакомительных сведений указано, что модель была обучена на Penn Treebank, OntoNotes и English Web...

926 просмотров

pos-tagger dependency-parsing syntaxnet parsey-mcparseface

06.04.2024

В R: Как решить ошибку «Недостаточно памяти» в POS-теггере?

В R у меня есть данные с 30 записями для выборки, основные данные имеют 20000 записей. записи — это твиты. Я извлекаю биграммы из любого твита и использую из постаггера. Для примера данных, которые показали мне ошибки...

2727 просмотров

r twitter pos-tagger opennlp semantic-analysis

25.08.2022

Извлечение национальностей и стран из текста

Я хочу извлечь все упоминания страны и национальности из текста с помощью nltk. Я использовал теги POS для извлечения всех токенов с меткой GPE, но результаты меня не удовлетворили. abstract="Thyroid-associated orbitopathy (TO) is an...

9117 просмотров

python nlp nltk pos-tagger

01.07.2023

Использование тегов Syntaxnet POS в python?

Я хочу использовать теги синтаксического анализатора (например: VBD ROOT, NN nsubj и т. д.) синтаксической сети в python, чтобы помочь создать чат-бота. Ввод осуществляется в консоли. Вопрос: Как получить в переменной результат только VBP ROOT и...

1213 просмотров

python nlp pos-tagger text-parsing syntaxnet

12.07.2022

Как использовать Keras для создания тега части речи?

Я пытаюсь реализовать метку части речи, используя нейронную сеть с помощью Keras. Я использую последовательную модель и данные обучения из Penn Treebank Corpus NLTK (т.е. из nltk.corpus import treebank). Насколько я понимаю, формирование нейронной...

3304 просмотров

keras deep-learning neural-network part-of-speech pos-tagger

01.02.2023

объясняя уродливые ошибки NLTK pos_tag

Я занимаюсь анализом текста с помощью Python3-NLTK. На этапе предварительной обработки я хотел реализовать разбиение на фрагменты имен-фраз, для чего требуется маркировка POS и выбор в соответствии с регулярное выражение (грамматика) . Мои...

83 просмотров

python-3.x nltk stanford-nlp pos-tagger

15.07.2022

Теги POS на уровне Word в Python

Я пытаюсь сделать тег pos для каждого слова в каждой строке (каждая строка содержит несколько предложений). У меня есть этот код: import nltk import pos_tag import nltk.tokenize import word_tokenize f = open('C:\Users\test_data.txt') data =...

596 просмотров

python tokenize pos-tagger

09.06.2023

Создание и использование тегированных корпусов с помощью NLTK

Я пытаюсь создать корпус с тегами на малагасийском (мой родной язык). Я следовал инструкциям в документе Обработка текста Python и обработка естественного языка , а также на странице https://www.nltk.org/book/ch05.html . Мне удалось создать...

236 просмотров

python nltk corpus pos-tagger

09.06.2022

Маркировка R POS и токенизация за один раз

У меня есть текст, как показано ниже. Section <- c("If an infusion reaction occurs, interrupt the infusion.") df <- data.frame(Section) Когда я токенизирую с помощью tidytext и приведенного ниже кода, AA <- df %>%...

1720 просмотров

r tokenize pos-tagger tidytext

11.10.2022

Python: тег pos — со словом «назад»

Как отличить почтовый тег back в следующих предложениях: испытывает прерывистую стреляющую боль в пояснице после столкновения где-то в затылке Примеры из космоса doc = nlp(u'experiencing intermittent shooting pain in her lower back...

69 просмотров

python spacy pos-tagger

16.07.2023