梯度消失问题和梯度爆炸问题一般随着网络层数的增加会变得越来越明显。

梯度消失  梯度爆炸_数据

 

 

 

 

梯度消失  梯度爆炸_网络层_02

 

 

梯度消失  梯度爆炸_网络层_03

 

 

其实梯度爆炸和梯度消失问题都是因为网络太深,网络权值更新不稳定造成的,本质上是因为梯度反向传播中的连乘效应。对于更普遍的梯度消失问题,可以考虑用ReLU激活函数取代sigmoid激活函数。另外,LSTM的结构设计也可以改善RNN中的梯度消失问题。