1.9 归一化输入(Normalizing inputs)
Previous1.8 其他正则化方法(Other regularization methods)Next1.10 梯度消失/梯度爆炸(Vanishing / Exploding gradients)
Last updated
Last updated
在训练神经网络时,标准化输入可以提高训练的速度
如果输入特征之间的范围比较接近,不进行标准化操作没有太大影响
由于训练集进行了标准化处理,测试集或在实际应用时,应该使用同样的和对其进行标准化处理。保证训练集和测试集的标准化操作一致
对输入进行标准化操作,是为了让所有输入归一化在同样的尺度上,方便进行梯度下降算法时能够更快更准确地找到全局最优解。假如输入特征是二维的,且的范围是[1,1000],的范围是[0,1]。如果不进行标准化处理,与之间分布极不平衡,训练得到的和也会在数量级上差别很大。这样导致的结果是costfunction与和的关系可能是一个非常细长的椭圆形碗。对其进行梯度下降算法时,由于和数值差异很大,只能选择很小的学习因子,来避免J发生振荡。一旦较大,必然发生振荡,不再单调下降。如果进行了标准化操作,与分布均匀,和数值差别不大,得到的cost function与和的关系是类似圆形碗。对其进行梯度下降算法时,可以选择相对大一些,且一般不会发生振荡,保证了是单调下降