多层卷积网络以及通道变化问题
一、多层卷积层单池化层的作用
卷积层提取特征,池化层选择特征,全连接层进行分类。
用卷积神经网络提取图片上的一只小猫时,卷积神经网络会先提取图片上不同方向的直线和拐角;接着组合成高阶特征,比如三角形,正方形等;再接着抽象组合成眼睛,鼻子,嘴巴等五官;最后将五官组合成一张脸,每个卷积层提取的特征在下一层都会抽象组合成更高阶特征。
单卷积层单池化层的Lenet卷积神经网络,提取特征不太丰富,出现了多卷积层单池化层的Alexnet卷积神经网络
两个卷积层或两个以上卷积层后才出现一个池化层,即卷积层串联。其实这是一种优化操作,通过增加卷积层数来缩小卷积核的尺寸,进而来减少参数,并且多层卷积层有多个非线性操作,优化前的单层卷积层只有一个非线性操作,优化后的对特征学习能力更强。
比如输入的数据尺寸为11*11*1,经过两个3*3*1的卷积核,数据尺寸变为7*7*1。相当于经过一个5*5*1的卷积核。即两个3*3*1的卷积核和一个7*7*1的感受野相同。
经过两个3*3*1的卷积核的计算过程:
(11-3)/1+1=9 数据尺寸此时为9*9*1
(9-3)/1+1=7 数据尺寸此时为7*7*1
经过一个5*5*1的卷积核的计算过程:
(11-5)/1+1=7 数据尺寸此时为7*7*1
二、卷积过程中通道变化问题
大家经常见到卷积神经网络中通道数增加的情况,比如227*227*3的彩色图像,经过一层卷积层输出数据尺寸变为55*55*96,通道数增加。这是因为输入数据被96个尺寸为11*11*3,步长为4不同的卷积核进行卷积运算,输入数据每经过一个尺寸为11*11*3,步长为4卷积核,都会产生一个55*55*1的数据,当经过96次卷积运算后,通道数变成了96,通道数变大。
以上如果有哪里表述不清楚的,欢迎大家留言指正