梯度消失梯度爆炸

转载

mb5fe1900cd6223 2020-04-07 14:21:00

梯度消失问题和梯度爆炸问题一般随着网络层数的增加会变得越来越明显。

梯度消失梯度爆炸_数据

梯度消失梯度爆炸_网络层_02

梯度消失梯度爆炸_网络层_03

其实梯度爆炸和梯度消失问题都是因为网络太深，网络权值更新不稳定造成的，本质上是因为梯度反向传播中的连乘效应。对于更普遍的梯度消失问题，可以考虑用ReLU激活函数取代sigmoid激活函数。另外，LSTM的结构设计也可以改善RNN中的梯度消失问题。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

梯度消失 梯度爆炸