Не удается запустить Mallet TopicModel

Я пытаюсь запустить тематическое моделирование Маллета, но получаю следующую ошибку:

Couldn't open cc.mallet.util.MalletLogger resources/logging.properties file.
Perhaps the 'resources' directories weren't copied into the 'class' directory.
Continuing.
Exception in thread "main" java.lang.IllegalArgumentException: Trouble reading file     stoplists\en.txt at    cc.mallet.pipe.TokenSequenceRemoveStopwords.fileToStringArray(TokenSequenceRemoveStopwords.java:144) at cc.mallet.pipe.TokenSequenceRemoveStopwords.<init>(TokenSequenceRemoveStopwords.java:73) at LDA.TopicModel.main(TopicModel.java:23)  

Я уже добавил все файлы jar! Не могли бы вы подсказать, в чем здесь проблема?

Спасибо,


person Ashkan    schedule 03.07.2014    source источник


Ответы (2)


Я получил первую ошибку, с которой он также может продолжить.

Но фактическое исключение, которое вас останавливает, похоже, заключается в том, что у вас нет списка стоп-слов MALLET в нужном месте. Я загрузил их список стоп-слов en.txt в определенное место и дал ему прямой путь вместо «stoplists/en.txt», что сработало.

person pjshap    schedule 14.11.2014

Ваш файл стоп-слов английского языка отсутствует (stoplists\en.txt). Либо попробуйте снова загрузить файлы jar, либо просто используйте maven, который облегчит вам импорт в ваш проект Java. В файл Maven POM добавьте:

<dependencies>
    <dependency>
        <groupId>cc.mallet</groupId>
        <artifactId>mallet</artifactId>
        <version>2.0.8</version>
    </dependency>
....
</dependencies>

Последнюю версию можно найти здесь.

person c-chavez    schedule 18.09.2017