ai python 语音识别 ai语音识别算法

转载

mob64ca1405664d 2023-08-17 21:47:48

文章标签 ai python 语音识别语言模型声学模型神经网络 文章分类 Python 后端开发

一、神经网络

ai python 语音识别 ai语音识别算法_语言模型

当前常用的语音识别框架如下图

ai python 语音识别 ai语音识别算法_神经网络_02

其背后的逻辑是

ai python 语音识别 ai语音识别算法_ai python 语音识别_03

在特征提取时采用的神经网络里面的DNN技术

ai python 语音识别 ai语音识别算法_ai python 语音识别_04

深度神经网络DNN

DNN技术可以分为两种，一种是CNN模型，一种是RNN模型

ai python 语音识别 ai语音识别算法_语言模型_05

卷积神经网络 CNN模型

ai python 语音识别 ai语音识别算法_声学模型_06

循环神经网络 RNN模型

二、解码器

解码器信息来源于声学模型、词典、语言模型。框图如下：

ai python 语音识别 ai语音识别算法_语言模型_07

2.1 声学模型

常用的声学模型为GMM-HMM，即混合高斯模型-隐马尔科夫模型

HMM模型对时序信息进行建模，在给定HMM的一个状态后，GMM对属于该状态的语音特征向量的概率分布进行建模。

2.2 词典

字典：就是发音字典，中文中就是拼音与汉字的对应，英文中就是音标与单词的对应

用途：

根据声学模型识别出来的音素，在字典中来找到对应的汉字（词）或者单词，用来在声学模型和语言模型建立桥梁，将两者联系起来。

比方如下词语的映射表：

ai python 语音识别 ai语音识别算法_声学模型_08

2.3 语言模型

语言模型是针对某种语言建立的概率模型，是用来计算一个句子的概率的概率模型。

划分以下两种：

2.3.1 N元统计语言模型：N-gram模型、平滑化

ai python 语音识别 ai语音识别算法_语言模型_09

2.3.2 神经网络语言模型：

ai python 语音识别 ai语音识别算法_语言模型_10

与统计语言模型不同的是，神经网络语言模型不通过计数的方法对nn元条件概率进行估计，而是直接通过一个神经网络对其建模求解。

用途：

1、决定哪一个词序列的可能性更大

   2、已知若干个词，预测下一个词

例子：

1、I went to a party.

Eye went two a bar tea.

2、你现在在干什么？

你西安载感什么？

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：android 微信渐变渐变微信头像图片

下一篇：android 源码系统通话activity android打电话代码

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

ai python 语音识别 ai语音识别算法

ai python 语音识别 ai语音识别算法

51CTO博客