下载提示

1.本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

2.该文档所得收入(下载+内容+预览三)归上传者、原创者。

3.登录后可充值,立即自动返金币,充值渠道很便利

课程名称∶ 语音识别技术/Speech Recognition Technology

课程代码∶ F03327

目 的∶(1) 使学生具备语音识别的基础理论知识、掌握技术和

方法,并了解有关语音识别的国内外最新动态;

培养和提高学生在多媒体信息处理方面的分析与解决问题的能力,为日后从事相关领域的工程技术工作、科学研究以及开拓新技术领域,打下坚实的基础。

大 纲∶(参见附一)

学 时 数∶ 36学时

授课形式∶ 课程

考核方法∶ 笔试+小论文

前修课程∶

教材与主要参考书∶

自编讲义(“语音识别技术”)

Lawrence Rabiner,Biing-Hwang Juang:“FUNDAMENTALS OF SPEECH RECOGNITION”,PTR Prentice-Hall,Inc,1993。

杨行峻,迟惠生等∶“语音信号数字处理”,电子工业出版社,1995。

附一∶


课程性质和任务

“语音识别技术”是计算机应用专业的一门专业课。它的主要任务是通过各个教学环节,运用各种教学手段和方法,使学生掌握有关语音识别的基础理论知识、技术和方法,并了解语音识别的国内外最新动态;培养和提高学生在多媒体信息处理方面的分析与解决问题的能力,为日后从事相关领域的工程技术工作、科学研究以及开拓新技术领域,打下坚实的基础。

课程的教学内容和基本要求

语音特征

·了解发音的生理机构与过程

·了解汉语语音基本特征

·理解并掌握语音特征在时域及频域中的表示方法

语音信息处理基础

·掌握语音信号的短时频普分析法

·理解基于线性系统的语音生成模型

·掌握语音信号的短时倒谱分析法

·掌握语音信号的线性预测分析法

·掌握语音信号的矢量量化法(VQ: Vector Quantization)

基于模式匹配方式的语音识别技术

·理解语音端点检测

·理解语音特征模式的距离测度

·理解与掌握动态时间归整法(DTW: Dynamic Time Warping)

·理解基于特征空间轨迹的时间规整法

基于统计模型方式的语音识别技术

·理解基于统计模型框架的识别法

·理解隐马尔柯夫模型(HMM: Hidden Markov Modle)的概念

·理解HMM的三个基本问题及掌握其解法

基于统计方式的语言模型技术

·理解语言模型的评估法

·理解与掌握基于马尔柯夫过程的语言模型

·理解与掌握基于语境自由句法的语言模型

连续语音识别系统

·理解连续语音识别系统的基本构成

·掌握几种典型的连续语音识别算法

语音识别中的说话人自适应技术

·理解语音的个性特征及说话人适应的原理

·掌握实现说话人自适应的方法

·掌握基于矢量量化的说话人自适应法

·掌握基于不特定说话人模型的自适应学习的说话人自适应法

语音识别中的鲁棒性技术

·理解在实用环境下进行语音识别的困难点

·理解在特征分析中进行鲁棒性处理的过程

·理解在模式(模型)匹配进行鲁棒性处理的过程

实验内容和基本要求

1.实验的学时数为9学时

2.实验以体现能力为主,不提模型,只提要求,可锻炼学生分析和解决问题能力。

实验内容:

要求学生通过自选一个语音识别课题进行上机实验,共安排3次实验(每次3学时)。通过实验,应使学生掌握语音信号的特征抽取及有关模式识别的工程算法,了解语音信号处理的实际过程,并具有分析、整理实验数据和编写实验报告的能力。

对研究生能力培养的要求

1.课内教学活动中能力培养的安排及要求:

在课内教学活动中侧重于培养学生理解专业算法的工程背景及语音信号处理中的工程考虑。

2.课外科技活动和社会实践等教学活动中能力培养的安排及要求:

通过兴趣小组等形式,广泛阅读相关论文,进行一定的仿真研究,使学生具有初步从事科研的能力。

其它需要说明的内容

为了培养学生科研的能力,本课程要求每位学生学完本课程后,要写一篇小论文。