Я запускаю алгоритм наивного байесовского классификатора через apache mahout. У нас есть возможность настроить размер грамма во время обучения и запуска экземпляра алгоритма.
Изменение моего размера n-Gram с 1 на 2 резко меняет результирующую классификацию. Почему это происходит? Как размер n-грамм сильно влияет на результат?