Скрытые марковские модели - Часть 1: проблема правдоподобия

Традиционное определение HMM исходит из неизменной поддержки Википедии, когда дело доходит до поиска новой темы:

Скрытая марковская модель (HMM) - это статистическая марковская модель, в которой моделируемая система считается марковским процессом с ненаблюдаемым (т. е. скрытые) состояния.

И снова определение марковской модели:

В теории вероятностей марковская модель - это стохастическая модель, используемая для моделирования случайно изменяющихся систем. Предполагается, что будущие состояния зависят только от текущего состояния, а не от событий, которые произошли до него (то есть предполагает марковское свойство).

Приложение Hidden Markov Models включает в себя обучение с подкреплением и временное распознавание образов, такое как речь, почерк, распознавание жестов, тегирование части речи, отслеживание нот, частичные разряды и Биоинформатика.

Теперь, когда у нас есть причудливые описания, мы собираемся рассмотреть довольно упрощенную версию HMM, чтобы наш мозг не начал жариться.

Возьмем Лию. Леа - наш воображаемый друг, и в течение дня она делает одно из следующих четырех действий:

Рисование
Уборка дома
Езда на велосипеде
Покупка продуктов

Не так уж много жизни, не так ли? Но в любом случае это список того, что называется наблюдаемыми. А теперь предположим, что через четыре дня Леа делает следующее: красит, убирает, делает покупки, ездит на велосипеде.

Из этой последовательности наблюдений мы хотим узнать, был ли день солнечным или дождливым. Эти два будут нашими скрытыми состояниями.

Вот график нашего потенциального HMM:

Начнем с того, что скрытая марковская модель состоит из следующих свойств:

Скрытые состояния S: в приведенном выше примере скрытыми состояниями являются солнечное и дождливое, и они сгруппированы в набор S.
Наблюдаемые O: покраска, уборка, покупки и велосипед. Они группируются в набор O.
Начальные вероятности 𝜋: матрица начальной вероятности состояния в момент времени t = 0. В этом случае вероятность того, что в первый день будет солнечно, равна 0,6, а вероятность того, что сейчас дождь, равна 0,4.
𝜋 = | 0,6, 0,4 |
Примечание: каждая строка следующих матриц должна давать в сумме 1, поскольку они представляют вероятность.
Вероятности перехода A: матрица, представляющая вероятность перехода в другое состояние с учетом текущего состояния. Например, если текущее состояние - солнечно, вероятность того, что следующий день будет солнечным, равна 0,8, тогда как вероятность того, что следующий день будет дождливым, равна 0,2.
Аналогично, если сегодня дождливый день, вероятность того, что завтра будет дождливым также составляет 0,6, в то время как вероятность того, что завтра будет солнечно, равна 0,4.

Вероятности выбросов B: матрица, представляющая вероятность увидеть конкретную наблюдаемую при скрытом состоянии. Например, вероятность чистоты в солнечный день составляет 0,1, а вероятность чистоты в дождливый день - 0,45.

В более математических терминах мы бы описали свойства этой модели как таковые:

Это все очень приятно, но сразу же мы сталкиваемся с тремя проблемами:

Проблема правдоподобия
Проблема декодирования
Проблема обучения

В этом первом руководстве мы собираемся проанализировать первую проблему, которая задает вопрос о вероятности определенной последовательности наблюдений, производной от модели HMM, которую мы инициализировали.

Проблема 1 - Вероятность

Возьмем начальный пример активности Ли за четыре дня. Последовательность наблюдения следующая: покраска, чистка, покупка и велосипед.

Итак, какова вероятность того, что эта последовательность наблюдений O может быть получена из нашей HMM λ?

P(O|λ) = ???

Есть два метода, с помощью которых мы можем вычислить это: алгоритм прямого и обратный.

Прямой алгоритм

Алгоритм пересылки состоит из трех шагов:

Инициализация
Рекурсия
Прекращение

Инициализация

Вышеприведенное уравнение означает, что первая прямая переменная вычисляется путем умножения начальной вероятности состояния i на вероятность выброса b этого состояния при наблюдаемом O во время 1.

Как можно видеть, начальная прямая переменная состояния Sunny - это начальная вероятность появления Sunny, 0,6, умноженная на вероятность выброса от Sunny до наблюдаемой Paint, 0,4. Следовательно, 0,24.

В то время как начальная прямая переменная состояния Rainy - это начальная вероятность Rainy, 0,4, умноженная на вероятность эмиссии от Rainy до наблюдаемой Paint, 0,3. Следовательно, 0,12.

Рекурсия

Для t = 1, 2,…, T-1 мы используем уравнение рекурсии, которое определяет прямую переменную состояния j как произведение предыдущей прямой переменной состояние i, умноженное на вероятность перехода a между предыдущим состоянием i в состояние j, умноженное на выброс вероятность b от состояния j до наблюдаемого O.

Я знаю, что это жарко, но давайте взглянем на диаграмму ниже:

Здесь мы вычисляем прямую переменную состояния Sunny во время 2, суммируя результаты двух умножений:

Предыдущая прямая переменная предыдущего состояния Sunny, 0,24, умноженная на вероятность перехода из Sunny в Sunny, 0,8, умноженная на вероятность выброса из Sunny в Clean, 0,1.
0,24 * 0,8 * 0,1 = 0,0192
Предыдущая прямая переменная предыдущего состояния Rainy, 0,12, умноженная на вероятность перехода из Rainy в Sunny, 0,4, умноженная на вероятность выброса из Sunny в Clean, 0,1.
0,12 * 0,4 * 0,1 = 0,0048

Затем, в соответствии с приведенным выше уравнением, мы суммируем эти результаты и получаем нашу прямую переменную.

α = 0.0192 +0.0048 = 0.024

Точно так же для следующего шага у нас будет прямая переменная 0,054 для состояния Rainy:

И так до тех пор, пока у нас не будут все прямые переменные:

Прекращение

Это последнее уравнение говорит нам, что для определения вероятности последовательности наблюдений O, полученной из модели HMM λ, нам нужно просуммировать все прямые переменные в момент времени T, т. Е. все переменные каждого состояния в конце последовательности наблюдений. Следовательно, в нашем примере выше,

P(O|λ) = 0.0028512 + 0.0003048 = 0.003156

Обратный алгоритм

Обычно, чтобы найти решение проблемы правдоподобия, нам не требуется знать обратный алгоритм. Однако его объяснение и решение являются хорошей лакмусовой бумажкой, чтобы показать, что алгоритм Forward работает профессионально, и, более того, понимая его сейчас, мы можем быть готовы к тому, когда придет время использовать его для решения третьей проблемы обучения. .

Обратный алгоритм аналогичен прямому алгоритму, но, как следует из названия, он идет в обратном направлении во времени. Снова есть инициализация, рекурсия и завершение.