1.9 GRU单元(Gated Recurrent Unit(GRU))
Previous1.8 循环神经网络的梯度消失(Vanishing gradients with RNNs)Next1.10 长短期记忆(LSTM(long short term memory)unit)
Last updated
Last updated
,。符号表示记忆细胞的值,表示输出的激活值,是个候选值,替代了c的值,(0到1)意为gate,u表示“update”,当时,代表更新;当时,代表记忆,保留之前的模块输出。能够保证RNN模型中跨度很大的依赖关系不受影响,消除梯度消失问题
完整的GRU添加了另外一个gate,即,表达式如下:
门:计算出的下一个的候选值跟有多大的相关性
可以是一个向量(编号1),如果有100维的隐藏的激活值,那么、、还有画在框中的其他值也是100维
实际上就是元素对应的乘积(),若()是一个100维的向量,而里面的值几乎都是0或者1,则这100维的记忆细胞(,编号1)就是要更新的比特