RNN LSTM区别 rnn和lstm关系

转载

ghpsyn 2024-02-18 20:10:50

文章标签 RNN LSTM区别 Network 神经网络依赖关系 文章分类 机器学习人工智能

这里写目录标题

RNN的引入

RNN的类别

两种Network
两边同时进行RNN

LSTM

LSTM流程
深入LSTM结构

RNN带来的梯度消失和梯度爆炸

解决梯度消失的方法：LSTM

RNN的应用

RNN的引入

RNN：具有记忆的神经网络。

一个词汇表示成一个Vector

RNN LSTM区别 rnn和lstm关系_神经网络

输入一个向量，第n个词的输入和第n-1个词的输出相加，然后生成第n个词的概率

RNN LSTM区别 rnn和lstm关系_依赖关系_02

多层的

RNN LSTM区别 rnn和lstm关系_依赖关系_03

RNN的类别

两种Network

RNN LSTM区别 rnn和lstm关系_依赖关系_04

两边同时进行RNN

除了可以获取从头到尾的信息，还能获取从尾到头的信息。

RNN LSTM区别 rnn和lstm关系_Network_05

LSTM

LSTM流程

简单来说，就是相比普通的RNN，LSTM能够在更长的序列中有更好的表现。现在的所说的RNN就是LSTM。

RNN LSTM区别 rnn和lstm关系_依赖关系_06

**一个局部LSTM：**每个f(x)函数都是用的sigmoid函数，就是生成0~1的值来表示这个阀门的打开程度大小。

流程：输入向量，输入门(Input Gate)以一定概率控制输入输入，遗忘门(Forget Gata)一一定概率记住这个值，然后输出门(Output Gate)以一定概率输出。LSTM的参数是普通神经网络的四倍

RNN LSTM区别 rnn和lstm关系_依赖关系_07

深入LSTM结构

1、首先使用LSTM的当前输入 $RNN LSTM区别 rnn和lstm关系_神经网络_08$ 和上一个状态传递下来的 $RNN LSTM区别 rnn和lstm关系_神经网络_09$ 拼接经过线性激活函数训练得到四个状态。

RNN LSTM区别 rnn和lstm关系_Network_10

RNN带来的梯度消失和梯度爆炸

RNN不好训练，因为梯度容易爆炸或者消失。

首先得明白RNN中梯度消失和平常的梯度消失不是一个概念。

RNN 所谓梯度消失的真正含义是，梯度被近距离梯度主导，导致模型难以学到远距离的依赖关系。

原因： 因为每次记忆都会覆盖上一次的值，长久的记忆下去，梯度被近距离梯度主导，远距离梯度很小，导致模型难以学到远距离的信息。

RNN LSTM区别 rnn和lstm关系_RNN LSTM区别_11

解决梯度消失的方法：LSTM

**原因：**一开始的LSTM没有遗忘门，也就是类似一个残差网络(ResNet)，上一次的数据完整的传给了下一次。后面产生遗忘门，每次都选择上次记忆的部分+这次的新值，不是直接覆盖。可以解决RNN中梯度消失的问题。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：flinksql将日期转时间戳 flink sql时间窗口

下一篇：python网络爬虫模拟点击按钮代码爬虫点击

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯