四川在线消息(鲁文林 四川日报记者 祖明远)整理录音是很多文字工作者的噩梦:将录音整理为文字,往往需要1-2倍录音时长的时间。近日,国内首款PC端长语音识别平台在绵阳问世——1小时的语音,只用10分钟就能转化为文字,而且识别率达到97%以上。而开发者的初衷居然是:为了方便整理领导讲话录音!
转换速度快 1小时录音只用10分钟
1月25日,记者在绵阳市高新区创业服务中心采访到了该产品的开发团队。只需将手机或录音笔上的录音传到电脑上,点开软件,短短几分钟,录音便能迅速转变为文字,准确率达97%以上。据介绍,一段1小时的录音只用了10多分钟,便完成了翻译,而且每句都分行显示,方便对其进行修改校正。
为什么速度这么快?据开发者介绍,其秘密在于通过独有的声学分析模型,该软件可以像“切片”一样,把长段语音压缩、分包,然后通过云端翻译,从而保证了语音翻译的准确、及时、高效。
受够了整理录音的苦 无奈自主开发软件
据开发团队介绍,目前国内已有一些语音识别软件,但都针对的是短语音。“都是类似于聊天那种,但是能将长文字快速转换为文字的,目前还仅有我们这一款。”开发者黄博说。
黄博曾在机关事业单位工作过,去年科博会期间,整理领导、嘉宾的发言,让他饱尝整理录音之苦。无奈之下,他将解决办法投向语音识别软件,但当时市面上的各种软件都只能针对短语音,而且识别率偏低。
在组建了开发团队后,用时1年才拿出产品。最初团队也曾考虑开发手机端,但受限于硬件条件,录音效果和文字编辑都受到很大限制,最后产品转向PC端。“我们的目标客户也是专业的文字工作者,例如律师、机关事业单位工作人员、记者编辑、作家等。”黄博说。
可以识别多种方言 “可玩性”很高
据介绍,目前该软件对普通话的识别率达到97%,同时还能识别山东话、河南话、粤语等方言,市场潜力较大。
黄博计划在春节前成立专门的公司,以进一步完善和推广该产品,未来将不仅限于文字办公领域,进军语言学习、游戏娱乐等领域。