Я пытаюсь реализовать наивный байесовский классификатор и действительно запутал проблему сглаживания Лапласа.
Вероятность получить слово в классе C:
<pre>
P(Wi|C) = (count(Wi,C) + 1) / (count(all, C) + |V|)
</pre>
Но что такое В? Это лексика только учебного корпуса? Или V - это весь английский словарь?