NLP中判定句子的办法 nlp检定语言模式运用

转载

云端筑梦师 2024-07-18 23:56:43

文章标签 NLP中判定句子的办法语音识别人工智能机器学习自然语言处理 文章分类 NLP 人工智能

智能语音质检是常见的内容审核和内容安全场景，随着5G和移动互联网的发展，无论是UGC社区、社交平台、娱乐平台，大量的C端业务都包括了语音、视频等富媒体内容。一方面，富媒体内容的信息量更高，用户更喜欢看、更喜欢传播；另一方面，以语音识别为核心的内容管理也越来越难。

传统的通过NLP语音识别，把音频转化成文字，再对文字做出“敏感词”、“敏感字”的正则或者上下文识别算法来鉴定违规内容的方式遇到了很多挑战。比如说，许多的主播使用“娇喘”的方式，就是无法被翻译为文字，并且没有任何关键敏感词的，但超过一定的尺度则属于违规内容。

针对语音质检的现状，通常头部的内容审核风控解决方案服务商，如图普科技等，采用的是综合大数据算法来提供审核服务。例如说，针对语音质检的内容：首先会尝试将音频识别为文字，再通过准确率和正确率综合超过95%的文字内容审核系统进行审核，由于文字有着更多的上下文关系，有具体的关键词和场景，不仅可以快速验证是否安全合规，而且可以为音频打上标签、分类的信息，有助于业务的精细化运营；其次如果音频并非识别为文字，再通过大数据算法，对声音的频率、音色等进行分析，识别娇喘等违规涉黄内容。最后，还可以通过声纹识别的方式，锁定定位某一个主播/用户，对其发布的所有内容加强审核或者直接进入人工审核。对于其换马甲、换ID的方式也可以更好的识别。

语音审核质检资料白皮书，现在已经可以在图普官网免费下载了。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。