Я только что посмотрел видео, где они использовали алгоритм Витерби, чтобы определить, предназначены ли определенные слова в предложении как существительные/глаголы/прилагательные и т. д., они использовали вероятности перехода и эмиссии, например вероятность того, что слово «время» используется в качестве глагол известен (испускание) и вероятность того, что существительное перейдет в глагол (переход).
http://www.youtube.com/watch?v=O_q82UMtjoM&feature=relmfu (Видео)
Как мне найти хороший набор данных о вероятностях перехода и выбросов для этого варианта использования?
Или ДАЖЕ только один пример со всеми отображаемыми вероятностями, я хочу использовать реалистичные числа в демонстрации.