智能语音质检是常见的内容审核和内容安全场景,随着5G和移动互联网的发展,无论是UGC社区、社交平台、娱乐平台,大量的C端业务都包括了语音、视频等富媒体内容。一方面,富媒体内容的信息量更高,用户更喜欢看、更喜欢传播;另一方面,以语音识别为核心的内容管理也越来越难。

传统的通过NLP语音识别,把音频转化成文字,再对文字做出“敏感词”、“敏感字”的正则或者上下文识别算法来鉴定违规内容的方式遇到了很多挑战。比如说,许多的主播使用“娇喘”的方式,就是无法被翻译为文字,并且没有任何关键敏感词的,但超过一定的尺度则属于违规内容。

针对语音质检的现状,通常头部的内容审核风控解决方案服务商,如图普科技等,采用的是综合大数据算法来提供审核服务。例如说,针对语音质检的内容:首先会尝试将音频识别为文字,再通过准确率和正确率综合超过95%的文字内容审核系统进行审核,由于文字有着更多的上下文关系,有具体的关键词和场景,不仅可以快速验证是否安全合规,而且可以为音频打上标签、分类的信息,有助于业务的精细化运营;其次如果音频并非识别为文字,再通过大数据算法,对声音的频率、音色等进行分析,识别娇喘等违规涉黄内容。最后,还可以通过声纹识别的方式,锁定定位某一个主播/用户,对其发布的所有内容加强审核或者直接进入人工审核。对于其换马甲、换ID的方式也可以更好的识别。

语音审核质检资料白皮书,现在已经可以在图普官网免费下载了。