摘要:

随着移动互联网和智能人机交互技术的迅猛发展,便捷、高效的人机交互方式得到了人们广泛关注。语音识别技术作为人机交互信息最自然的方式,它有效地改善了人工使用键盘、鼠标等传统交互方式所带来的速度慢、较易出差错等缺点,从而使得语音识别技术在人机交互中的应用占比越来越大,并逐渐成为现阶段具有竞争价值的新兴高科技的产业热点。语音识别技术目前在移动智能终端上的应用发展迅速,人们可以直接通过语音对其进行全程操控,比如拨打电话、搜索信息、打开应用等。与此同时,人们也开始尝试将基于移动智能终端的语音识别技术应用到一些控制领域,以提高人机交互效率并取得了不错的效果,但该技术仍处于起步阶段,因此对其在不同领域的应用研究具有广泛的应用价值和发展前景。基于此,本文在CMU Sphinx工具箱的基础上,研究了语音识别技术在Android平台的实现,并尝试将其应用到电子货架标签(Electronic Shelf Label, ESL)管理系统中,以提高其操作的便携性和工作效率。本文首先对语音识别系统中的关键技术进行了详细地介绍和分析,并针对强噪声环境下的语音端点检测,提出了一种结合小波变换和基于短时能零差分阀值检测的方法,实验验证了该方法有利于提高带噪语音的信噪比和端点检测正确率。然后重点对基于Android平台语音识别系统进行设计与实现,并将实现的Android语音系统应用到ESL管理系统中,通过对该系统进行相关测试,来验证其效果与性能。通过对整个系统的识别率、抗噪性和操作效率进行测试,结果表明该ESL语音管理系统能够以较高的识别性能和人机交互效率实现对ESL的声控可移动管理,有利于ESL的推广和应用,同时也为基于Android平台的语音识别技术在其他领域的应用提供了可供参考的案例和思路。