2.3 残差网络为什么有用?(Why ResNets work?)

如果Residual blocks确实能训练得到非线性关系,那么也会忽略short cut,跟Plain Network起到同样的效果

CNN中ResNets的结构:

Last updated