Transformer是模型架构 transformer模型优点

转载

mob6454cc64e36b 2024-01-17 13:36:09

文章标签 Transformer是模型架构 python 编码器全连接机器翻译 文章分类 架构后端开发

一、Transformer的优势（相比于LSTM和GRU）：

1、Transformer能够利用分布式GPU进行并行训练，提升模型训练效率。
2、在分析预测更长的文本时，捕捉间隔较长的语义关联效果更好。

二、Transformer模型的作用：

基于seq2seq架构的transformer模型可以完成NLP领域研究的典型任务，如机器翻译、文本生成等，同时又可以构建预训练语言模型，用于不同任务的迁移学习。

三、Transformer的总体架构：

Transformer是模型架构 transformer模型优点_编码器

总体的架构图分为四部分：

1、输入部分：

（1）包含两部分：

1、源文本嵌入层及其位置编码器。

2、目标文本嵌入层及其位置编码器。

Transformer是模型架构 transformer模型优点_Transformer是模型架构_02

（2）文本嵌入层的作用：

无论是源文本嵌入还是目标文本的嵌入，都是为了将文本中词汇的数字转变为向量表示，希望在这样的高维空间捕捉词汇间的关系。

2、输出部分：

（1）包含两部分：

1、线性层（得到outputsize）。

2、softmax层（提取出来概率最大的那个值）。

Transformer是模型架构 transformer模型优点_机器翻译_03

3、编码器：

（1）包含四个部分：

1、由N个编码器层堆叠而成。

2、每个编码器层由两个子层连接结构组成。

3、第一个子层连接结构包括一个多头自注意力子层和规范化层以及一个残差连接。

4、第二个子层连接结构包含一个前馈全连接子层和规范化层以及一个残差链接。

Transformer是模型架构 transformer模型优点_全连接_04

4、解码器：

（1）包含五部分：

（1）由N个解码器堆叠而成。

（2）每个解码器由三个子层连接结构组成。

（3）第一个子层连接结构包含一个多头自注意力子层和规范化层以及一个残差链接。

（4）第二个子层连接结构包含一个多头注意力子层和规范化层以及一个残差连接。

（5）第三个子层连接结构包含一个前馈全连接子层和规范化层以及一个残差连接。

Transformer是模型架构 transformer模型优点_python_05

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：根据进程号查看属于哪个docker 根据进程id查看进程信息

下一篇：viso反向工程添加mysql 数据库反向工程

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯