Вопросы по теме 'mallet'

Не удается запустить Mallet TopicModel
Я пытаюсь запустить тематическое моделирование Маллета, но получаю следующую ошибку: Couldn't open cc.mallet.util.MalletLogger resources/logging.properties file. Perhaps the 'resources' directories weren't copied into the 'class' directory....
585 просмотров
schedule 25.01.2023

Применение Маллета в классификации документов в качестве бинарного классификатора
Я реализовал инструмент классификации документов с помощью Mallet, который классифицирует каждую страницу документа по определенным категориям. Я тоже пробовал Weka, но Маллет умнее Weka в этом аспекте. Мой подход следующий: Обучить страницы...
431 просмотров

Текстовая классификация с использованием MALLET
Я новичок в использовании Маллета. Я обычно использую WEKA для классификации, а теперь пытаюсь использовать Mallet для классификации текста. В Weka есть атрибуты (такие как длина слова или появление первого слова), которые мы выбираем сами и создаем...
1136 просмотров
schedule 27.07.2023

Генерация документов из тематической модели LDA
Я изучаю модель темы из набора документов, и это работает хорошо. Но мне интересно, действительно ли какая-либо существующая система будет генерировать новые документы из тем и слов в модели. Т.е. скажем, я хочу новый документ по теме 0, будет...
580 просмотров
schedule 22.03.2023

Как мне использовать Mallet для моей задачи маркировки последовательностей?
Я пытаюсь включить пакет молотка в свой код Java для моей задачи маркировки последовательности. Однако я не очень уверен, как мне это сделать, используя только рекомендации по импорту данных на веб-сайте маллета. Кто-нибудь может мне помочь? Мой...
668 просмотров
schedule 24.09.2022

Как импортировать данные с помощью Mallet Java API
Я новичок в Mallet и пытаюсь использовать его функции CRF для распознавания именованных объектов. Я знаю, что на их веб-сайте есть пример, показывающий, как импортировать данные с помощью Java, но он имеет дело с простыми текстами (не в формате...
548 просмотров
schedule 12.04.2024

Китайские иероглифы искажаются при импорте в MALLET
Я пытаюсь использовать MALLET для тематического моделирования китайского текста. В качестве первого шага я использовал Stanford Word Segmenter, чтобы получить что-то вроде этого: > 关于 处理 五反运动 遗留 问题 的 指示 转发 华东局 批转 浙江 省委 批转 省委 办公厅 关于 粮食 统销...
149 просмотров
schedule 19.02.2023

Как использовать молоток для API тематического моделирования
Есть ли здесь кто-нибудь, кто успешно использует API-интерфейс молотка для моделирования темы. мне трудно понять, даже пока я не знаю, как импортировать текст в качестве данных. Вы, ребята, знаете какой-нибудь хороший источник, чтобы узнать о коде?...
284 просмотров
schedule 22.04.2023

Маллет: Алфавиты не совпадают, исключение при повторном создании модели в одной программе
Я изучил маллет, и он работает хорошо. То, что я пытаюсь сделать, это дважды создать модель в области программы и столкнуться с исключением. Мой программный код выглядит так: List<String> commands = new ArrayList<String>();...
96 просмотров
schedule 24.02.2023

Правильный способ загрузки модели LdaMallet с помощью gensim и классификации невидимых документов
В своем проекте я использую библиотеку Python gensim для тематического моделирования/извлечения текст. Я пытаюсь загрузить свою обученную модель LdaMallet для классификации новых невидимых текстов. Первая часть загружает модель. import os...
1264 просмотров
schedule 12.07.2022

Как я могу создать экземпляр молотка из объекта значения функции?
У меня есть объект json , например {"f1": 2.1, "f2": 3.2, "f3": 1234.12, "label": "GOOD"} Я хочу преобразовать его в экземпляр mallet
26 просмотров
schedule 09.11.2022

Lda Mallet вернул ненулевой статус выхода 1
Я пытаюсь написать код для модели LDA Mallet... Я запустил ее пару месяцев назад, и она работала нормально, но больше не работает. Были и другие сообщения на ту же тему, но решения еще не помогли мне. Может ли кто-нибудь понять, что не так в моем...
229 просмотров
schedule 11.10.2022

Python Mallet LDA Errno 2 Нет такого файла или каталога
Я сохранил модель LDAWallet: Сначала я сделал поезд: mallet_path = 'mallet-2.0.8/bin/mallet' ldamallet = gensim.models.wrappers.LdaMallet(mallet_path, corpus=corpus, id2word=id2word, num_topics=14) А затем я сохранил модель, используя...
450 просмотров
schedule 01.03.2023

Рекомендуемое количество слов в Mallet
Я пытаюсь смоделировать topcis с помощью Mallet. Я неоднократно встречал заявления в блогах и исследовательских работах, рекомендующие ограничить количество слов в документе — в большинстве случаев около 1000 слов. То, что LDA требует минимального...
27 просмотров
schedule 06.06.2022