一、简介

主要是基于DragonBoard™410c开发的可以与用户简单语音交互的智能音箱设备。智能音箱在基础音乐播放的功能上,用户可以用语音控制音乐的播放、停止和切换歌曲。

ES8388 语音识别 噪音_智能音箱

二、语音识别

语音识别技术是将计算机接收、识别和理解语音信号转变为相应的文本文件或者命令的技术。它是一门涉及到语音语言学、信号处理、 模式识别、概率论和信息论、发声机理和听觉机理、人工智能的交叉学科。在语音识别系统的帮助下,即使用户不懂电脑或者无法使用电脑,都可以通过语音识别系统对电脑进行操作。

我们要做的智能音箱,需要用的语音识别技术,或者更确切的说是关键字识别,识别特定的一些关键字后进行相应的功能控制。

三、讯飞MSC SDK

国内外做语音识别的公司有很多,国内做的比较好的是讯飞,我们选用讯飞公司提供的语音识别SDK来进行我们此次的开发。

科大讯飞MSC(Mobile Speech Client,移动语音终端)Android版SDK,提供了语音听写、语音识别、语音合成、语义理解、语音评测等功能,这些功能从调用开始到结果返回,大多使用接口(Interface)回调(Callback)的方式返回结果和状态,比较简单方便,容易集成。

MSC SDK 的主要功能接口如下图所示

ES8388 语音识别 噪音_dragonboard-410c_02

ES8388 语音识别 噪音_语音识别_03