神经网络与 NLP 有什么区别 nlp神经网络算法

关注 mob64ca140f67e3

文章目录

文章目录
1 背景
2 RNN
3 LSTM
3.1 遗忘门
3.2 输入门
3.3 信息更新
3.4 输出门
4 GRU
4.1 重置门
4.2 信息更新
4.3 更新门

神经网络与 NLP 有什么区别 nlp神经网络算法

转载

mob64ca140f67e3 2023-12-25 15:31:22

文章标签 神经网络与 NLP 有什么区别自然语言处理重置语义信息线性模型 文章分类 神经网络人工智能

文章目录

1 背景
2 RNN
3 LSTM

3.1 遗忘门
3.2 输入门
3.3 信息更新
3.4 输出门

4 GRU

4.1 重置门
4.2 信息更新
4.3 更新门

1 背景

在解决文本相关的任务时，各单词之间在语义上是有关联的。

若直接使用全连接层等线性模型，则会丢失各单词之间的联系。
CNN模型虽然可以构建相邻单词的联系，但受限于窗口大小，该模型仅能建立有限邻近单词之间的联系。

因此，一种新的模型被提出，期望能改进上述两种模型的缺陷，既能建立单词之间的联系，同时使单词的信息可以传递到更远的位置。这一模型便是循环神经网络。

迄今为止，主要有3种循环神经网络模型被提出，分别是RNN、LSTM、GRU，下面我们将依次展开讨论。

2 RNN

RNN模型结构如下所示，该模型思路是，希望将模型前一时刻输出与当前时刻输入结合，产生当前时刻输出。

神经网络与 NLP 有什么区别 nlp神经网络算法_重置

其中

$神经网络与 NLP 有什么区别 nlp神经网络算法_线性模型_02$
$神经网络与 NLP 有什么区别 nlp神经网络算法_线性模型_03$
$神经网络与 NLP 有什么区别 nlp神经网络算法_重置_04$ 是当前时刻的输出，在RNN模型里，它既是当前时刻输出，也被用作下一时刻隐藏层的输入。
$神经网络与 NLP 有什么区别 nlp神经网络算法_线性模型_05$
引入tanh激活函数目的主要有两点：

大多问题并非线性模型可解决，因此引入非线性变换；
限制输出值大小，避免其在经过多个单元传递之后过大。

该模型具有一个重要的缺陷：输出值在多个Cell之间依次传递，这一过程容易产生梯度爆炸或梯度消失现象。
为了降低该问题的影响，在RNN基础上，LSTM模型被提出。

3 LSTM

LSTM模型结构如下所示，该模型思路是通过遗忘门、输入门、输出门的控制，将往期语义信息、前一时刻输出、当前时刻输入各变量进行组合，得到当前时刻输出及当前时刻希望保留的往期语义信息。

神经网络与 NLP 有什么区别 nlp神经网络算法_自然语言处理_06

该模型利用Sigmoid函数进行门阀控制，利用tanh函数控制输入、输出的界限。

3.1 遗忘门

神经网络与 NLP 有什么区别 nlp神经网络算法_重置_07

用于控制往期语义信息有多少在当前时刻的计算中得到保留，其中

遗忘门计算： $神经网络与 NLP 有什么区别 nlp神经网络算法_重置_08$
经过遗忘门之后，被保留的过往信息为 $神经网络与 NLP 有什么区别 nlp神经网络算法_重置_09$

3.2 输入门

神经网络与 NLP 有什么区别 nlp神经网络算法_重置_10

用于控制当前输入有多少可被采用，其中

经过输入门之前，当前时刻输入信息为 $神经网络与 NLP 有什么区别 nlp神经网络算法_自然语言处理_11$
输入门计算： $神经网络与 NLP 有什么区别 nlp神经网络算法_语义信息_12$
经过输入门之后，当前时刻输入信息为 $神经网络与 NLP 有什么区别 nlp神经网络算法_线性模型_13$

3.3 信息更新

神经网络与 NLP 有什么区别 nlp神经网络算法_重置_14

对经过遗忘门与输入门的信息流进行整合，更新被保留的语义信息作为下一时刻往期信息的输入。

其计算方式为： $神经网络与 NLP 有什么区别 nlp神经网络算法_语义信息_15$

3.4 输出门

神经网络与 NLP 有什么区别 nlp神经网络算法_自然语言处理_16

用于控制更新后的信息有多少将作为当前时刻的输出及下一时刻的隐藏层输入，其中

输出门计算： $神经网络与 NLP 有什么区别 nlp神经网络算法_重置_17$
经过输出门之后，当前时刻的输出信息为 $神经网络与 NLP 有什么区别 nlp神经网络算法_神经网络与 NLP 有什么区别_18$

该模型增加了过往信息的传输距离，同时降低了梯度消失的可能性。但是该模型的缺陷在于参数较多，模型计算较慢。
于是，另一种参数更少的模型，GRU模型，也被广泛使用。

4 GRU

GRU模型如下所示，该模型思想是通过重置门替代LSTM中的遗忘门与输入门、通过更新门替代LSTM中的输出门，将上一时刻隐藏层输出和当前时刻输入进行组合，得到当前时刻输出。

神经网络与 NLP 有什么区别 nlp神经网络算法_神经网络与 NLP 有什么区别_19

4.1 重置门

用于控制上一时刻的输入有多少信息得到保留。
其中 $神经网络与 NLP 有什么区别 nlp神经网络算法_自然语言处理_20$

4.2 信息更新

结合经过重置门后的上一时刻输入与当前时刻模型输入，得到更新后的信息： $神经网络与 NLP 有什么区别 nlp神经网络算法_线性模型_21$

4.3 更新门

用于控制模型输出有多少信息来自上一时刻的输入，有多少信息来自于当前时刻更新后的信息。

更新门计算： $神经网络与 NLP 有什么区别 nlp神经网络算法_重置_22$
模型当前时刻输出： $神经网络与 NLP 有什么区别 nlp神经网络算法_重置_23$

对于GRU模型

参数数量减少，有助于提升模型计算效率
重置门有助于捕捉序列里短期的关系
更新门有助于捕捉序列里长期的关系

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

赞
收藏
评论
分享
举报

上一篇：ios 开发对电脑的要求开发用苹果还是windows

下一篇：xml中的 style 如何用代码设置 android xml怎么用

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费直播
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册