CNN与FCN结合使用 cnn和fcn的区别

转载

mob6454cc6c1f4a 2024-03-29 19:56:50

文章标签 CNN与FCN结合使用深度学习网络 cnn 卷积 文章分类 机器学习人工智能

1.1、CNN与FCN的比较

参考博客CNN: 在传统的CNN网络中，在最后的卷积层之后会连接上若干个全连接层，将卷积层产生的特征图（feature map）映射成为一个固定长度的特征向量。一般的CNN结构适用于图像级别的分类和回归任务，因为它们最后都期望得到输入图像的分类的概率，如ALexNet网络最后输出一个1000维的向量表示输入图像属于每一类的概率。如下图所示：

CNN与FCN结合使用 cnn和fcn的区别_CNN与FCN结合使用

在CNN中, 猫的图片输入到AlexNet, 得到一个长为1000的输出向量, 表示输入图像属于每一类的概率, 其中在“tabby cat”这一类统计概率最高, 用来做分类任务。FCN: FCN是对图像进行像素级的分类（也就是每个像素点都进行分类），从而解决了语义级别的图像分割问题。与上面介绍的经典CNN在卷积层使用全连接层得到固定长度的特征向量进行分类不同，FCN可以接受任意尺寸的输入图像，采用反卷积层对最后一个卷基层的特征图（feature map）进行上采样，使它恢复到输入图像相同的尺寸，从而可以对每一个像素都产生一个预测，同时保留了原始输入图像中的空间信息，最后奇偶在上采样的特征图进行像素的分类。如下图所示：

CNN与FCN结合使用 cnn和fcn的区别_卷积_02

简单的说，FCN与CNN的区别在于FCN把CNN最后的全连接层换成卷积层，其输出的是一张已经标记好的图，而不是一个概率值。

2、FCN上采样理论讲解

FCN网络一般是用来对图像进行语义分割的，于是就需要对图像上的各个像素进行分类，这就需要一个上采样将最后得到的输出上采样到原图的大小。上采样对于低分辨率的特征图，常常采用上采样的方式将它还原高分辨率，这里陈述上采样的三种方法。

CNN与FCN结合使用 cnn和fcn的区别_网络_03

2.2、反卷积上采样

怎样上采样：普通的卷积操作，会使得分辨率降低，如下图33的卷积核去卷积4* 4得到2*2的输出。

CNN与FCN结合使用 cnn和fcn的区别_网络_04

上采样的过程也是卷积，那么怎么会得到分辨率提高呢？之前我们看卷积时有个保持输出与输入同分辨率的方法就是周围补0

其实上面这种补0的方法事有问题的，你想一下，只在四周补0会导致最边上的信息不太好，那我们把这个信息平均下，在每个像素与像素之间补0，如下图所示：

CNN与FCN结合使用 cnn和fcn的区别_卷积_05

CNN与FCN结合使用 cnn和fcn的区别_CNN与FCN结合使用_06

2.3、反池化上采样

反池化可以用下图来理解，再池化时需要记录下池化的位置，反池化时把池化的位置直接还原，其他位置填0。

CNN与FCN结合使用 cnn和fcn的区别_CNN与FCN结合使用_07

2、 FCN具体实现过程

FCN与CNN的核心区别就是FCN将CNN末尾的全连接层转化成了卷积层：以Alexnet为例，输入是2272273的图像，前5层是卷积层，第5层的输出是256个特征图，大小是66，即2566*6，第6、7、8层分别是长度是4096、4096、1000的一维向量。如下图所示

CNN与FCN结合使用 cnn和fcn的区别_CNN与FCN结合使用_08

在FCN中第6、7、8层都是通过卷积得到的，卷积核的大小全部是1 * 1，第6层的输出是4096 * 7 * 7，第7层的输出是4096 * 7 * 7，第8层的输出是1000 * 7 * 7（7是输入图像大小的1/32）,即1000个大小是77的特征图（称为heatmap），如下图所示：

CNN与FCN结合使用 cnn和fcn的区别_CNN与FCN结合使用_09

经过多次卷积后，图像的分辨率越来越低，为了从低分辨率的热图heatmap恢复到原图大小，以便对原图上每一个像素点进行分类预测，需要对热图heatmap进行反卷积，也就是上采样。论文中首先进行了一个上池化操作，再进行反卷积（上述所提到的上池化操作和反卷积操作，其实可以理解为上卷积操作），使得图像分辨率提高到原图大小。如下图所示：

CNN与FCN结合使用 cnn和fcn的区别_深度学习_10