一、简介
主要是基于DragonBoard™410c开发的可以与用户简单语音交互的智能音箱设备。智能音箱在基础音乐播放的功能上,用户可以用语音控制音乐的播放、停止和切换歌曲。
二、语音识别
语音识别技术是将计算机接收、识别和理解语音信号转变为相应的文本文件或者命令的技术。它是一门涉及到语音语言学、信号处理、 模式识别、概率论和信息论、发声机理和听觉机理、人工智能的交叉学科。在语音识别系统的帮助下,即使用户不懂电脑或者无法使用电脑,都可以通过语音识别系统对电脑进行操作。
我们要做的智能音箱,需要用的语音识别技术,或者更确切的说是关键字识别,识别特定的一些关键字后进行相应的功能控制。
三、讯飞MSC SDK
国内外做语音识别的公司有很多,国内做的比较好的是讯飞,我们选用讯飞公司提供的语音识别SDK来进行我们此次的开发。
科大讯飞MSC(Mobile Speech Client,移动语音终端)Android版SDK,提供了语音听写、语音识别、语音合成、语义理解、语音评测等功能,这些功能从调用开始到结果返回,大多使用接口(Interface)回调(Callback)的方式返回结果和状态,比较简单方便,容易集成。
MSC SDK 的主要功能接口如下图所示