基于高斯分布的 MMSE 语音增强算法估计



帧移:帧移后的每一帧信号都有上一帧的成分,防止两帧之间的不连续。语音信号虽然短时可以认为平稳,但是由于人说话并不是间断的,每帧之间都是相关的,加上帧移可以更好地与实际的语音相接近。



加窗:由于直接对信号(加矩形窗)截断会产生频率泄露,为了改善频率泄露的情况,加非矩形窗,一般都是加汉明窗,因为汉明窗的幅频特性是旁瓣衰减较大,主瓣峰值与第一个旁瓣峰值衰减可达40db。



频谱泄露(截断效应):信号为无限长序列,运算需要截取其中一部分(截断),于是需要加窗函数,加了窗函数相当于时域相乘,于是相当于频域卷积,于是频谱中除了本来该有的主瓣之外,还会出现本不该有的旁瓣,这就是频谱泄露!为了减弱频谱泄露,可以采用加权的窗函数,加权的窗函数包括平顶窗、汉宁窗、高斯窗等等。而未加权的矩形窗泄露最为严重。频谱泄露就是分析结果中,出现了本来没有的频率分量。



先验信噪比:先可以是方差,一阶统计量是均值,二阶统计量方差对应能量,但是具体计算的时侯不一定非得用方差。

后验 观测信号的能量(signal+noise)与noise能量的比值,当然这个noise的能量是你估计出来的,只是一个估计值。。。

就是比如你观察到的信号是 signal+ noise,此时的signal 与noise的能量比就是先验信噪比,当然一般算的是signal的估计值与noise的估计值的能量比。

当然这个值是根据你的观测矢量算出来的。那还有一个后验的信噪比,指的是观测信号与noise的能量比。



MMSE算法:

利用已经有的观测量 估计估计量的取值,减小关于估计量的不确定性




估值:


利用已有的观测量的信息,


估计估计量的取值,


减小关于估计量的不确定性。