Получайте баллы по непрерывной шкале от рекомендателя Mahout с логическими данными

У меня есть ориентированный граф, выраженный как (последователи, подписчики), и я хотел бы попытаться использовать Mahout для получения рекомендаций для новых ребер в графе (иначе прогнозировать новых пользователей, за которыми, вероятно, будут следить). Это код, с которого я начал:

mahout recommenditembased --input input.txt --output output.txt -s SIMILARITY_TANIMOTO_COEFFICIENT --booleanData -n 2

Кажется, это дает результат, в котором все рекомендации получают одинаковую оценку:

2 [4:1.0,3:1.0]
3 [2:1.0]
...

Есть ли способ получить оценки рекомендаций по непрерывной шкале, чтобы я мог ранжировать рекомендации подписчиков на основе оценки? Должен ли я попробовать другую метрику сходства?


person ADJ    schedule 18.11.2014    source источник


Ответы (1)


Это должно дать взвешенные результаты от 0 до 1 для сортировки, поэтому все ваши результаты будут иметь очень высокий рейтинг. Попробуйте SIMILARITY_LOGLIKELIHOOD, который почти всегда лучше и дает другой тип взвешивания, все еще нормализованный, чтобы соответствовать от 0 до 1.

person pferrel    schedule 20.11.2014