4.6 参数 VS 超参数(Parameters vs Hyperparameters)

神经网络中的参数是W[l]W^{[l]}b[l]b^{[l]}

超参数则是例如学习速率α\alpha,训练迭代次数NN,神经网络层数LL,各层神经元个数n[l]n^{[l]},激活函数g(z)g(z)

叫做超参数的原因是它们决定了参数W[l]W^{[l]}b[l]b^{[l]}的值

如何设置最优的超参数:

通常的做法是选择超参数一定范围内的值,分别代入神经网络进行训练,测试cost function随着迭代次数增加的变化,根据结果选择cost function最小时对应的超参数值

Last updated