一、HMM中的第三个基本问题

O=O1O2…OT,如何调节模型μ=(A,B,π)的参数,使得P(O|μ)最大化:


argmaxμP(Otraining|μ)


模型的参数是指构成

μ的 πi,aij,bj(k)。本文的前序两节讲的EM算法就是为了解决模型参数的最大化问题。其基本思想是,初始时随机地给模型参数赋值,该赋值遵循模型对参数的限制,例如,从某一状态出发的所有转移概率之和为1.给模型参数赋初值后,得到模型 μ0, 然后根据 μ0可以得到模型中隐变量的期望值。例如,从 μ0得到某一状态到另一状态的期望次数,用期望次数来替代实际次数,这样可以得到模型参数的重新估计值,由此得到新的模型 μ1。然后重复上述过程,直到参数收敛于最大似然估计值。

二、算法介绍

μ和观察序列O=O1O2…OT在时间t位于状态si,时间t+1位于状态sj的概率:


ξt(i,j)=P(qt=si,qt+1=sj|O;μ)(1≤t≤T,1≤i,j≤N)


可由下面的公式计算获得:



ξt(i,j)=P(qt=si,qt+1=sj,O;μ)P(O;μ)=at(i)aijbj(Ot+1)βt+1(j)P(O;μ)=at(i)aijbj(Ot+1)βt+1(j)∑Ni=1∑Nj=1at(i)aijbj(Ot+1)βt+1(j)(18−1)


    给定HMM的参数

μ和观察序列 O=O1O2…OT在时间 t位于状态si的概率 γt(i)为:



γt(i)=∑j=1Nξt(i,j)(18−2)


由此,

μ的参数可由下式估计:



πi¯=P(q1=si|O;μ)=γ1(i)a¯ij=Q中从状态qi转移到qj的期望次数Q中所有从状态qi转移到另一状态(包含qj)的期望次数=∑T−1t=1ξt(i,j)∑T−1t=1γt(i)b¯j(k)=Q中从状态qj输出符号vk的期望次数Q到达qj的期望次数=∑Tt=1γt(j)δ(Ot,vk)∑Tt=1γt(j)

三、前向后向算法

    根据上述思路,给出前向后向算法:
1. 初始化:随机地给参数πi,aij,bj(k)赋值,使得满足如下约束:


∑i=1Nπi=1∑j=1Naij=1,1≤i≤N∑k=1Mbj(k)=1,1≤j≤N


由此,得到模型

μ0.令 i=0,执行下面的EM估计。


2. EM计算


E步:由模型

μi根据公式18-1和18-2计算 ξt(i,j)和 γt(i);


M步:用E步得到的期望值重新估计模型参数

πi,aij,bj(k),得到模型 μi+1

3. 循环计算:



i=i+1, 重复EM计算,直到 πi,aij,bj(k)收敛。