Я успешно запустил mahout lda и отобразил вывод с помощью команды mahout ldatopics.
Например, мои темы - наука и спорт. тогда вывод будет таким: тема 0 баскетбол, игра, бейсбол тема 1 исследование, учеба, философия
Теперь мой вопрос заключается в том, как я могу определить группу или кластер отдельной статьи. Есть ли идентификационный номер или какое-то отслеживание, чтобы каждая новая статья, которую я добавляю, группировалась или добавлялась в определенный кластер/тему.
Если у меня уже есть кластер, что делать дальше?
Спасибо