Я более подробно изучаю некоторые примеры кода в Mahout in Action. Я создал небольшой тест, который вычисляет среднеквадратичное значение различных алгоритмов, примененных к моим данным.
Конечно, несколько параметров влияют на RMS, но я не понимаю сообщение «невозможно рекомендовать в... случаях», которое генерируется при выполнении оценки.
Глядя на StatsCallable.java, это генерируется, когда оценщик встречает ответ NaN; Возможно, недостаточно данных в тренировочном наборе или настройках пользователя, чтобы дать рекомендацию.
Похоже, что на оценку RMS не влияет очень большой набор случаев «невозможно рекомендовать». Верно ли это предположение? Должен ли я оценивать свой алгоритм не только по среднеквадратичному значению, но и по соотношению случаев «не могу рекомендовать» по сравнению с моим общим тренировочным набором?
Буду признателен за любые отзывы.