Last updated 5 years ago
反向传播计算方向与前向传播基本上是相反:
识别人名的例子,经过RNN正向传播,单个元素的Loss function为:
这是 binary classification 的 Loss Function,注意与1.6 的softmax Loss Function区别
该样本所有元素的Loss function为:
反向传播(Backpropagation)过程就是从右到左分别计算L(y^,y)L(\hat y,y)L(y^,y)对参数WaW_{a}Wa,WyW_{y}Wy,bab_aba,byb_yby的偏导数,这种从右到左的求导过程被称为Backpropagation through time
RNN反向传播示意图: