AugFPN论文阅读_自适应

题目:改进多尺度特征学习用于目标检测

AugFPN论文阅读_自顶向下_02

AugFPN论文阅读_神经网络_03

AugFPN论文阅读_自顶向下_04

FPN的三个缺陷也正好对应着这三个阶段:
1. 特征混合之前
我们知道,FPN在特征混合之前,backbone的不同stage学习到的特征需要先经过1*1卷积进行一个降维,降到通道数相同才能进行特征相加。然而不同stage学习到的特征感受野是不一样的,包含的语义信息也不同。把两个语义信息差距较大的特征直接相加,势必会减弱多尺度特征的表达能力
简言之:特征求和前不同层次特征之间的语义差异
2. 自顶向下的特征融合
自顶向下的特征融合过程就是将顶层的高级特征和底层的低级特征相融合的过程,这样虽然底层的特征得到了来自顶层的高级特征的加强,然而由于顶层的特征经过1*1降维,势必会造成信息损失。
简言之:金字塔顶层层次特征的信息丢失
3. 特征混合之后
我们知道,FPN中每个候选区域(ROI)的特征都是根据proposal的尺度来决定相应的特征图从哪一层选择,然而那些忽略的层也是包含着丰富信息的,它们对最终的分类和回归结果也有着影响。直接忽略了其它层的特征势必会影响到最终的检测结果。
简言之:RoIs的启发式分配策略

AugFPN论文阅读_语义信息_05

针对FPN中存在的这三个缺陷,这篇论文依次提出三个结构用于解决这三个缺陷。
Consistent Supervision(一致性监督)
作者对混合之后的特征图M2-M5做了一个监督。具体做法是,对RPN网络得到的每一个候选区域都分别映射到M2~M5上得到相应的feature map,然后直接对这些feature map做分类和回归,可以得到一个损失函数。
将这一损失和网络本身的损失做一个加权求和。由于在测试阶段,这个分支是不参与计算的,所以Consistent Supervision对模型最终的参数和计算量没有影响。
Residual Feature Augmentation(残差特征增强)
由于FPN特征融合之前需要先进行1x1的特征降维,这会导致M5的信息损失。
为了避免这种信息损失,作者提出了一种很巧妙的办法。因为C5的信息是没有损失的,如果能够将C5的信息融合到M5上,就可以有效减少这种信息损失了。
为此作者提出了ASF的结构,如PPT6 (a)所示。首先按照比例不变,对C5进行自适应池化操作,然后对每个尺度的特征图进行1*1降维,然后对降维后的特征进行上采样,
对上采样之后的特征按照学习到的权重进行相加,把相加完之后的特征称之为M6,再将M6和M5进行相加作为最终的没有损失的M5。
Soft RoI Selection(软RoI选择)
FPN中ROI对应的特征是根据ROI的尺度选择对应提取的层,一般小的ROI对应低级特征,大的ROI对应高级特征。
然而事实上,这并不是一种最优的办法。因为有时候两个相同大小的ROI可能会被分到不同层的特征,即使某个ROI被分到了某一层,但其实其它层的特征也包含着描述这个ROI的信息。
因此,论文提出了一种Soft RoI Selection的办法。具体做法是,对于任意一个ROI,我们都会提出它在不同层的特征图上所对应的特征,然后利用网络本身学习权重参数,
将这些不同层上的特征进行求和作为这个ROI最终的特征,这一结构和Residual Feature Augmentation中使用的自适应求和操作是一样的。

AugFPN论文阅读_深度学习_06

AugFPN论文阅读_自顶向下_07

与COCO test-dev上的最新方法进行比较。符号“ *”表示我们的重新实施结果。
对于Mask R-CNN,()中的结果表示相应的Mask结果。[]中的数字代表相对改进。培训时间表遵循设置为Detectron [11]的设置