生成词向量的一种方法
​​理解GloVe模型(Global vectors for word representation)​​ GRU是LSTM的一种变形,LSTM和CRU都是通过各种门函数来将重要特征保留下来,这样就保证了在long-term传播的时候也不会丢失。此外GRU相对于LSTM少了一个门函数,因此在参数的数量上也是要少于LSTM的,所以整体上GRU的训练速度要快于LSTM的。
两个网络的好坏还是得看具体的应用场景。
​门控循环单元(GRU)的基本概念与原理​