证明“我是我”是一个历久弥新的话题,近年来,生物识别技术迎来市场爆发,向商用和民用领域加速扩张:指纹识别在考勤、门锁、手机上普及;人脸识别在支付、安防、金融等领域颇有建树;安防、电子商务等领域尝试将虹膜识别作为重点进行应用推广;指静脉识别在高端公寓、别墅家居等领域获得一定的应用。
相较于上面提到的几种生物识别技术,诞生于上世纪四十年代贝尔实验室的声纹识别好像不露锋芒、稍显低调。但实际上,拥有广阔应用前景的声纹识别,正在金融、政企、安防等领域大展拳脚。如2018年10月9日,央行正式发布《移动金融基于声纹识别的安全应用技术规范》,标志着语音信号可以为金融安全保驾护航,开启无监督情形下一种全新的“声纹+”身份认证方式。
鉴于声纹识别背后有很大的市场静待挖掘,我国许多企业都在这一领域进行布局。今天,我们就将目光聚焦于这些企业。
在视觉感知、语音识别和语义理解等方面拥有不俗实力的依图科技,于声纹识别赛道中也是种子选手。2019年9月,在国际声纹识别权威竞赛VoxSRC上,依图算法夺得第一,等错误率降到0.0098,并且依图团队在使用指定数据的情况下,取得优于其他团队使用不限数据得到的结果。
国音智能的声纹业务已落地多个省市公安部门,并与腾讯达成长期战略合作,未来,国音声纹识别技术还将进入腾讯物联网生态平台。2019年8月19日,国音智能宣布在声纹识别技术上取得重大突破,其推出的区分性CNN-VLAD-LM声纹识别技术,在开源声纹数据集VoxCeleb上,等误识率降低至2.84%。
声扬科技在声纹识别方面有深厚的积累,在声纹方面已推出声纹1:1,声纹1:N和性别识别等功能,识别准确率超过99.5%,且能够支持百万级并发和百万级数据库的声纹识别。为避免录音带来的潜在威胁,声扬科技自主开发声音活体检测技术,进一步提升声纹识别的安全性。
平安科技的声纹识别依托亿小时级的声纹库、99.7%的声纹识别率、广维度的特征提取等技术,8秒可实现电话核身、3秒可实现APP认证,并可拦截欺诈,降低风险。
造极声音自主研发了包括短语音文本无关声纹识别、文本相关声纹识别及数字动态口令声纹识别技术。为实现快速准确的身份认证,造极声音提供不同方式的说话人确认和辨认服务,可用于司法声纹鉴定、社保身份认证、大规模声纹检索、呼叫中心身份认证等场景中。
专业从事声纹识别、语音识别与语言理解技术研发和商业化应用的得意音通,是IFAA联盟(互联网金融身份认证联盟)成立的远程声纹认证工作组组长。在声纹识别领域,得意音通集技术研发、产品开发和服务提供于一身。
除此之外,科大讯飞、云知声、同盾科技、快商通、远鉴科技、声瀚科技等AI企业也在声纹识别领域奋力耕耘。
结语:不难发现,人类社会在从符号ID到生物ID的路上一直在默默前行。不过,需要注意的是,距离远近、语种、口音和不同使用环境和终端都会对声纹识别带来挑战,相关企业需持续推进解决这些问题,方能进一步打开市场。