Как использовать молоток для API тематического моделирования

Есть ли здесь кто-нибудь, кто успешно использует API-интерфейс молотка для моделирования темы. мне трудно понять, даже пока я не знаю, как импортировать текст в качестве данных. Вы, ребята, знаете какой-нибудь хороший источник, чтобы узнать о коде? я не считаю, что mallet.cs.umass.edu полезен.

PS: я не говорю о руководстве по командной строке, поэтому, пожалуйста, не давайте мне таких ответов.


person Lutfi Meidina    schedule 24.12.2017    source источник


Ответы (1)


Я полагаю, вы видели обучающие слайды? http://mallet.cs.umass.edu/mallet-tutorial.pdf Это лучший ресурс для понимания импорта данных.

Пример кода может быть наиболее полезным в противном случае. Вот пример API модели темы, который включает в себя импорт данных, обучение теме и некоторый код для извлечения распределений слов темы: https://github.com/mimno/Mallet/blob/master/src/cc/mallet/examples/TopicModel.java

person David Mimno    schedule 26.12.2017