卷积神经网络的单层结构如下所示:
相比之前的卷积过程,CNN的单层结构多了激活函数ReLU和偏移量b。整个过程与标准的神经网络单层结构非常类似:
Z[l]=W[l]A[l−1]+b[l] A[l]=g[l](Z[l]) 卷积运算对应着上式中的乘积运算,滤波器组数值对应着权重W[l],所选的激活函数为ReLU
每个滤波器组有3x3x3=27个参数,还有1个偏移量b,则每个滤波器组有27+1=28个参数,两个滤波器组总共包含28x2=56个参数。选定滤波器组后,参数数目与输入图片尺寸无关。所以不存在由于图片尺寸过大,造成参数过多的情况,这就是卷积神经网络的一个特征,叫作“避免过拟合”。例如一张1000x1000x3的图片,标准神经网络输入层的维度将达到3百万,而在CNN中,参数数目只由滤波器组决定,数目相对来说要少得多,这是CNN的优势之一
设层数为l,CNN单层结构的所有标记符号:
f[l]= filter size
nc[l]= number of filters
输入维度为:nH[l−1]×nW[l−1]×nc[l−1],因为是上一层的激活值
每个滤波器组维度为:f[l]×f[l]×nc[l−1]
权重维度为:f[l]×f[l]×nc[l−1]×nc[l]
偏置维度为:1×1×1×nc[l]
输出维度为:nH[l]×nW[l]×nc[l]
其中:
nH[l]=⌊s[l]nH[l−1]+2p[l]−f[l]+1⌋ nW[l]=⌊s[l]nW[l−1]+2p[l]−f[l]+1⌋ 如果有m个样本,进行向量化运算,相应的输出维度为:
m×nH[l]×nW[l]×nc[l]