长短期记忆网络部署在jetson tx2 什么是长短期记忆网络

转载

mob64ca13f53d41 2024-03-26 11:18:06

文章标签 神经网络深度学习结点遗忘因子级联 文章分类 深度学习人工智能

长短期记忆网络（LSTM）

1.LSTM介绍

LSTM 表示长短期记忆网络，当我们的神经网络需要在记忆最近的事物和很久以前的事情之间切换时，LSTM 是非常有用的。

2.RNN vs LSTM

RNN存储的都是短期记忆，并不擅长长期记忆，LSTM增加了长期记忆的输入和输出。

3.LSTM基础

引入长期记忆块，它作为每一次预测的输入，并且在每次预测后都根据短期记忆，长期记忆和当前事件进行更新长期记忆和短期记忆。共三个输入和两个输出（短期记忆就是当前结点预测结果）。

引入四个门：

长短期记忆网络部署在jetson tx2 什么是长短期记忆网络_结点

1、长期记忆进入遗忘门，忘记它认为没有用处的一切。

2、短期记忆和当前事件进入学习门合并在一起，囊括了我们刚刚学习的东西，并移除掉一切不必要的信息。

3、还没遗忘的长期记忆和刚学到的新信息会在记忆门中合并在一起，然后记忆门输出更新后的长期记忆。

4、最后，使用门决定从还没遗忘的长期记忆和刚学到的信息中挑选什么来使用，从而做出预测。

级联的结构如下：

长短期记忆网络部署在jetson tx2 什么是长短期记忆网络_遗忘因子_02

4.LSTM的架构

RNN架构回顾：

时间 $长短期记忆网络部署在jetson tx2 什么是长短期记忆网络_级联_03$ 和记忆 $长短期记忆网络部署在jetson tx2 什么是长短期记忆网络_深度学习_04$ 作为输入，首先将两者放在一起，然后再乘以矩阵 $长短期记忆网络部署在jetson tx2 什么是长短期记忆网络_级联_05$ ，再加一个偏差 $长短期记忆网络部署在jetson tx2 什么是长短期记忆网络_遗忘因子_06$ ，然后把整个公式套在 $长短期记忆网络部署在jetson tx2 什么是长短期记忆网络_深度学习_07$ 中，从而得到输出 $长短期记忆网络部署在jetson tx2 什么是长短期记忆网络_遗忘因子_08$ , $长短期记忆网络部署在jetson tx2 什么是长短期记忆网络_遗忘因子_08$ 作为该结点的预测，也是下个结点的记忆。

长短期记忆网络部署在jetson tx2 什么是长短期记忆网络_遗忘因子_10

LSTM架构：

长短期记忆网络部署在jetson tx2 什么是长短期记忆网络_神经网络_11

5.学习门

学习门要做的是：取短期记忆和事件，将两者合并，然后忽略其中的一部分，只保留重要的部分。

合并操作公式如下， $长短期记忆网络部署在jetson tx2 什么是长短期记忆网络_遗忘因子_12$ 是刚学到的新信息。

长短期记忆网络部署在jetson tx2 什么是长短期记忆网络_深度学习_13

然后进行忽略一部分，即引入遗忘因子 $长短期记忆网络部署在jetson tx2 什么是长短期记忆网络_神经网络_14$ 。

$长短期记忆网络部署在jetson tx2 什么是长短期记忆网络_级联_15$

如何计算 $长短期记忆网络部署在jetson tx2 什么是长短期记忆网络_神经网络_14$ 呢？还是用短期记忆和事件作为输入，构建小型网络进行计算。总过程如下图所示：

长短期记忆网络部署在jetson tx2 什么是长短期记忆网络_遗忘因子_17

6.遗忘门

遗忘门的输入是长期记忆，输出是遗忘后的长期记忆。

这里也引入一个遗忘因子 $长短期记忆网络部署在jetson tx2 什么是长短期记忆网络_级联_18$ ，和 $长短期记忆网络部署在jetson tx2 什么是长短期记忆网络_神经网络_14$ 一样，它也是由短期记忆和事件作为输入，构建小型网络进行计算得到的。

长短期记忆网络部署在jetson tx2 什么是长短期记忆网络_深度学习_20

7.记忆门

记忆门的输入是遗忘后的长期记忆 $长短期记忆网络部署在jetson tx2 什么是长短期记忆网络_遗忘因子_21$ 和刚学到的新信息 $长短期记忆网络部署在jetson tx2 什么是长短期记忆网络_级联_22$ ，输出是更新后的长期记忆 $长短期记忆网络部署在jetson tx2 什么是长短期记忆网络_神经网络_23$