一、HMM中的第三个基本问题
O=O1O2…OT,如何调节模型μ=(A,B,π)的参数,使得P(O|μ)最大化:
argmaxμP(Otraining|μ)
模型的参数是指构成
μ的
πi,aij,bj(k)。本文的前序两节讲的EM算法就是为了解决模型参数的最大化问题。其基本思想是,初始时随机地给模型参数赋值,该赋值遵循模型对参数的限制,例如,从某一状态出发的所有转移概率之和为1.给模型参数赋初值后,得到模型
μ0, 然后根据
μ0可以得到模型中隐变量的期望值。例如,从
μ0得到某一状态到另一状态的期望次数,用期望次数来替代实际次数,这样可以得到模型参数的重新估计值,由此得到新的模型
μ1。然后重复上述过程,直到参数收敛于最大似然估计值。
二、算法介绍
μ和观察序列O=O1O2…OT在时间t位于状态si,时间t+1位于状态sj的概率:
ξt(i,j)=P(qt=si,qt+1=sj|O;μ)(1≤t≤T,1≤i,j≤N)
可由下面的公式计算获得:
ξt(i,j)=P(qt=si,qt+1=sj,O;μ)P(O;μ)=at(i)aijbj(Ot+1)βt+1(j)P(O;μ)=at(i)aijbj(Ot+1)βt+1(j)∑Ni=1∑Nj=1at(i)aijbj(Ot+1)βt+1(j)(18−1)
给定HMM的参数
μ和观察序列
O=O1O2…OT在时间
t位于状态si的概率
γt(i)为:
γt(i)=∑j=1Nξt(i,j)(18−2)
由此,
μ的参数可由下式估计:
πi¯=P(q1=si|O;μ)=γ1(i)a¯ij=Q中从状态qi转移到qj的期望次数Q中所有从状态qi转移到另一状态(包含qj)的期望次数=∑T−1t=1ξt(i,j)∑T−1t=1γt(i)b¯j(k)=Q中从状态qj输出符号vk的期望次数Q到达qj的期望次数=∑Tt=1γt(j)δ(Ot,vk)∑Tt=1γt(j)
三、前向后向算法
根据上述思路,给出前向后向算法:
1. 初始化:随机地给参数πi,aij,bj(k)赋值,使得满足如下约束:
∑i=1Nπi=1∑j=1Naij=1,1≤i≤N∑k=1Mbj(k)=1,1≤j≤N
由此,得到模型
μ0.令
i=0,执行下面的EM估计。
2. EM计算
E步:由模型
μi根据公式18-1和18-2计算
ξt(i,j)和
γt(i);
M步:用E步得到的期望值重新估计模型参数
πi,aij,bj(k),得到模型
μi+1
3. 循环计算:
令
i=i+1, 重复EM计算,直到
πi,aij,bj(k)收敛。