基于 matlab 分析语音信号频域特征.doc
语音信号处理实验报告实验三基于MATLAB分析语音信号频域特征所在院系工学院专业电子信息工程班级电信112姓名学号指导教师汤永清2014年05月06日实验三基于MATLAB分析语音信号频域特征一、实验目的信号的傅立叶表示在信号的分析与处理中起着重要的作用。因为对于线性系统来说,可以很方便地确定其对正弦或复指数和的响应,所以傅立叶分析方法能完善地解决许多信号分析和处理问题。另外,傅立叶表示使信号的某些特性变得更明显,因此,它能更深入地说明信号的各项红物理现象。由于语音信号是随着时间变化的,通常认为,语音是一个受准周期脉冲或随机噪声源激励的线性系统的输出。输出频谱是声道系统频率响应与激励源频谱的乘积。声道系统的频率响应及激励源都是随时间变化的,因此一般标准的傅立叶表示虽然适用于周期及平稳随机信号的表示,但不能直接用于语音信号。由于语音信号可以认为在短时间内,近似不变,因而可以采用短时分析法。本实验要求掌握傅里叶分析原理,会利用已学的知识,编写程序估计短时谱、倒谱,画出语谱图,并分析实验结果,在此基础上,借助频域分析方法所求得的参数分析语音信号的基音周期或共振峰。
二、实验原理
1、短时傅立叶变换由于语音信号是短时平稳的随机信号,某一语音信号帧的短时傅立叶变换的定义为其中WNM是实窗口函数序列,N表示某一语音信号帧。令NMK,则得到同样,不同的窗口函数,将得到不同的傅立叶变换式的结果。由上式可见,短时傅立叶变换有两个变量N和Ω,所以它既是时序N的离散函数,又是角频率Ω的连续函数。与离散傅立叶变换逼近傅立叶变换一样,如令Ω2ΠK/N,则得离散的短时傅立叶吧如下
2、语谱图水平方向是时间轴,垂直方向是频率轴,图上的灰度条纹代表各个时刻的语音短谱。语谱图反映了语音信号的动态频率特性,在语音分析中具有重要的实用价值。被成为可视语言。语谱图的时间分辨率和频率分辨率是由窗函数的特性决定的。时间分辨率高,可以看出时间波形的每个周期及共振峰随时间的变化,但频率分辨率低,不足以分辨由于激励所形成的细微结构,称为宽带语谱图;而窄带语谱图正好与之相反。宽带语谱图可以获得较高的时间分辨率,反映频谱的快速时变过程;窄带语谱图可以获得较高的频率分辨率,反映频谱的精细结构。两者相结合,可以提供带两与语音特性相关的信息。语谱图上因其不同的灰度,形成不同的纹路,称之为“声纹”。声纹因人而异,因此可以在司法、安全等场合得到应用。
3、复倒谱和倒谱在时域上,语音产生模型实际上是一个激励信号与声道冲激响应的卷积。对于浊音,激励信号可以由周期脉冲序列表示;对于清音,激励信号可以由随机噪声序列表示。声道系统相当于参数缓慢变化的零极点线性滤波器。这样经过同态处理后,语音信号的复倒谱,激励信号的复倒谱,声道系统的复倒谱之间满足下面的关系由于倒谱对应于复倒谱的偶部,因此倒谱与复倒谱具有同样的特点,很容易知道语音信号的倒谱,激励信号的倒谱以及声道系统的倒谱之间满足下面关系浊音信号的倒谱中存在着峰值,它的出现位置等于该语音段的基音周期,而清音的倒谱中则不存在峰值。利用这个特点我们可以进行清浊音的判断,并且可以估计浊音的基音周期。
4、基因周期估计浊音信号的倒谱中存在峰值,它的出现位置等于该语音段的基音周期,而清音的倒谱中则不存在峰值。利用倒谱的这个特点,我们可以进行语音的清浊音判决,并且可以估计浊音的基音周期。首先计算语音的倒谱,然后在可能出现的基因周期附近寻找峰值。如果倒谱峰值超过了预先设置的门限,则输入语音判断为浊音,其峰值位置就是基因周期的估计值;反之,如果没有超出门限的峰值的话,则输入语音为清音。
5、共振峰估计对倒谱进行滤波,取出低时间部分进行进行逆特征系统处理,可以得到一个平滑的对数谱函数,这个对数谱函数显示了输入语音段的共振峰结构,同时谱的峰值对应于共振峰频率。通过此对数谱进行峰值检测,就可以估计出前几个共振峰的频率和强度。对于浊音的声道特性,可以采用前三个共振峰来描述;清音不具备共振峰特点。
二、实验结果1短时谱2语谱图3倒谱和复倒谱图3、4是加矩形窗和汉明窗的倒谱图和复倒谱图,图中横轴的单位是HZ,纵轴的单位是DB。4基因周期和共振峰估计
四、参考程序CLEARAWAVREADBEIJINGWAVSUBPLOT2,1,1,PLOTATITLEORIGINALSIGNALGRIDN256HHAMMINGN1NBMAMHMENDY20LOGABSFFTBSUBPLOT2,1,2PLOTYTITLEGRID0051152253354X104050051ORIGINALSIGNAL05010015020025030015010050050义义义X,FS,NBITSWAVREADBEIJINGWAVSPECGRAMX,512,FS,100XLABELSYLABELΜHZTITLE0051152253354X104050051ORIGINALSIGNAL义义S义义HZ义义义0511522533544501000200030004000CLEARAWAVREADBEIJINGWAV,4000,4350N300HLINSPACE1,1,N1NBMAMHMENDCCCEPSBCFFTSHIFTCDRCEPSBDFFTSHIFTDSUBPLOT2,1,1PLOTDTITLEΜΜSUBPLOT2,1,2PLOTCTITLEΜΜ05010015020025030064202义义义义义义义义05010015020025030064202义义义义义义义义义CLEARAWAVREADBEIJINGWAV,4000,4350N300HHAMMINGN1NBMAMHMENDCCCEPSBCFFTSHIFTCDRCEPSBDFFTSHIFTDSUBPLOT2,1,1PLOTDTITLEΜΜSUBPLOT2,1,2PLOTCTITLEΜΜ05010015020025030064202义义义义义义义义05010015020025030010505义义义义义义义义义语音信号处理实验报告实验四基于MATLAB的LPC分析所在院系工学院专业电子信息工程班级电信112姓名学号指导教师汤永清2014年05月06日实验四基于MATLAB的LPC分析一、实验目的线性预测分析是᳔有效的语音分析技术之一,在语音编码、语音合成、语音识别和说话人识别等语音处理领域中得到了广泛的应用。语音线性预测的基本思想是一个语音信号的抽样值可以用过去若干个取样值的线性组合来逼近。通过使实际语音抽样值与线性预测抽样值的均方误差达到᳔小,可以确定唯一的一组线性预测系数。采用线性预测分析不仅能够得到语音信号的预测波形,而且能够提供一个非常好的声道模型。如果将语音模型看作激励源通过一个线性时不变系统产生的输出,那么可以利用LP分析对声道参数进行估值,以少量低信息率的时变参数精确地描述语音波形及其频谱的性质。此外,LP分析还能够对共振峰、功率谱等语音参数进行精确估计,LP分析得到的参数可以作为语音识别的重要参