门控循环网络
深度学习的概念源于对人工神经网络的研究,门控循环单元GRU神经网络是深度学习的一种。长短期记忆网络(LSTM)在RNN的基础上,通过引入门控操作解决了其梯度爆炸的问题,而GRU网络实际上是LSTM网络一种较为成功的变体【1,2,3】。

对比一般的神经网络,GRU网络收敛速度快且不容易发生梯度消失的情况,主要原因是该网络复杂的门控单元(细胞状态)通过偏置和相关参数来实时和灵活的调整激活函数的输入,进而控制门的开启和关闭,保存和更新有用的信息,将过程中的梯度进行了抵消,使得GRU深度门控网络具有高效的性能,适合于处理时间序列中间隔和延迟非常长的事件,如预测风速,入库径流,未来天气状况、温度湿度等。GRU神经网络结构如图1中所示。

图1 GRU深度门控网络架构
Fig. 1 GRU deep gated network architecture
![图中更新门 用于描述前一时刻的状态信息被带入到当前状态中的程度,更新门的阈值越大说明前一时刻的状态信息将会带入的越多,有助于捕捉时序序列中长期的依赖关系。重置门 用于描述前一时刻的状态信息被忽略的程度,重置门的阈值越小说明忽略的信息越多,有助于捕捉时序序列中短期的依赖关系。其网络前向传播权重参数更新公式如下[22]:(8) 门控神经网络算法 门控循环神经网络_门控神经网络算法_03](https://s2.51cto.com/images/blog/202308/08020731_64d132e34154274153.png?x-oss-process=image/watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_30,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=/resize,m_fixed,w_1184)

[1] C. Gulcehre, K. Cho, R. Pascanu, et al. Learned-norm pooling for deep feedforward and recurrent neural networks [M]. In Machine Learning and Knowledge Discovery in Databases, pages 530–546. Springer, 2014.
[2] Graves A, Jürgen Schmidhuber. Framewise phoneme classification with bidirectional LSTM and other neural network architectures[J]. Neural Networks, 2005, 18(5-6): 602-610.
[3] 李文武, 石强, 王凯, 等. 基于变分模态分解和深度门控网络的径流预测[J]. 水力发电学报, 2020, 39(3): 34-44.
















