3.10 随机初始化(Random+Initialization)
随机初始化:
Previous3.9 (选修)直观理解反向传播(Backpropagation intuition )NextPlanar data classification with one hidden layer
Last updated
随机初始化:
Last updated
神经网络模型中的参数权重不能全部初始化为零
如果权重和都初始化为零,即:
这样使得隐藏层第一个神经元的输出等于第二个神经元的输出,即。经过推导得到,,这样的结果是隐藏层两个神经元对应的权重行向量和每次迭代更新都会得到完全相同的结果,始终等于,完全对称。这样隐藏层设置多个神经元就没有任何意义
权重全部初始化为零带来的问题称为symmetry breaking problem
让比较小,是因为如果使用函数或者函数作为激活函数的话,比较小,得到的也比较小(靠近零点),而零点区域的梯度比较大,这样能大大提高梯度下降算法的更新速度,尽快找到全局最优解
如果较大,得到的也比较大,附近曲线平缓,梯度较小,训练过程会慢很多
如果激活函数是或者 函数,则不需要考虑这个问题
如果输出层是函数,则对应的权重最好初始化到比较小的值