01-突破序列建模瓶颈：解密RNN为何成为NLP任务的核心引擎

原创

公众号JavaEdge 2025-03-17 23:22:31 ©著作权

文章标签 机器翻译文本分类数据 文章分类 深度学习人工智能 yyds干货盘点

©著作权归作者所有：来自51CTO博客作者公众号JavaEdge的原创作品，请联系作者获取转载授权，否则将追究法律责任

1 啥是RNN模型？

以序列数据为输入，通过网络内部的结构设计有效捕捉序列之间的关系特征，一般也以序列形式进行输出。

一般单层神经网络结构：

InputHiddenOutput

RNN单层网络结构：

01-突破序列建模瓶颈：解密RNN为何成为NLP任务的核心引擎_机器翻译

以时间步对RNN进行展开后的单层网络结构：

01-突破序列建模瓶颈：解密RNN为何成为NLP任务的核心引擎_文本分类_02

RNN的循环机制使模型隐层上一时间步产生的结果，能作为当下时间步输入的一部分(当下时间步的输入除了正常的输入外还包括上一步的隐层输出)对当下时间步的输出产生影响。

2 RNN模型的作用

RNN结构能很好利用序列之间的关系，因此针对自然界具有连续性的输入序列，如人类语言、语音等进行很好处理，广泛应用于NLP领域各项任务，如文本分类, 情感分析, 意图识别, 机器翻译等。

以一个用户意图识别的例子进行简单的分析：

01-突破序列建模瓶颈：解密RNN为何成为NLP任务的核心引擎_机器翻译_03

第一步：用户输入"What time is it ?"，先要对它进行基本的分词，因为RNN是按序工作，每次只接收一个单词进行处理。

01-突破序列建模瓶颈：解密RNN为何成为NLP任务的核心引擎_机器翻译_04

第二步：先将单词"What"输给RNN，它将产生一个输出O1

01-突破序列建模瓶颈：解密RNN为何成为NLP任务的核心引擎_文本分类_05

第三步：继续将单词"time"输给RNN，但此时RNN不仅利用"time"产生输出O2，还会用来自上一层隐层输出O1作为输入信息：

01-突破序列建模瓶颈：解密RNN为何成为NLP任务的核心引擎_文本分类_06

第四步：重复直到处理完所有单词：

01-突破序列建模瓶颈：解密RNN为何成为NLP任务的核心引擎_文本分类_07

第五步：最后，将最终的隐层输出O5进行处理来解析用户意图：

01-突破序列建模瓶颈：解密RNN为何成为NLP任务的核心引擎_机器翻译_08

3 RNN模型分类

两个角度对RNN模型分类：

3.1 输入和输出的结构

① N vs N - RNN

RNN最基础的结构形式，最大特点是输入和输出序列等长。由于这限制，使其适用范围较小，可用于生成等长度的合辙诗句。

y₁      y₂      y₃      y₄                      ↑       ↑       ↑       ↑                      │       │       │       │        ┌───┴───┐ ┌───┴───┐ ┌───┴───┐ ┌───┴───┐ ┌───┴───┐        │   h0  │→│   h₁  │→│   h₂  │→│   h₃  │→│   h₄  │        └───┬───┘ └───┬───┘ └───┬───┘ └───┬───┘ └───┬───┘                      ↑       ↑       ↑       ↑                      │       │       │       │                      x₁      x₂      x₃      x₄