3.9 (选修)直观理解反向传播(Backpropagation intuition )
单个训练样本反向过程可以根据梯度计算方法逐一推导:
dz[2]=a[2]−y dW[2]=dz[2]⋅∂W[2]∂z[2]=dz[2]a[1]T db[2]=dz[2]⋅∂b[2]∂z[2]=dz[2]⋅1=dz[2] dz[1]=dz[2]⋅∂a[1]∂z[2]⋅∂z[1]∂a[1]=W[2]Tdz[2]∗g[1]′(z[1]) dW[1]=dz[1]⋅∂W[1]∂z[1]=dz[1]xT db[1]=dz[1]⋅∂b[1]∂z[1]=dz[1]⋅1=dz[1] 浅层神经网络(包含一个隐藏层),m个训练样本的正向传播过程和反向传播过程分别包含了6个表达式,其向量化矩阵形式如下图所示: