YOLOv5的正负样本匹配策略
关于YOLOv5的正负样本匹配策略网上已经有很多参考资料了,推荐大家先看一下这一篇:
这位博主讲得十分详细了,我这里结合我个人的一些理解对YOLOv5的正样本匹配策略进行一些补充:
正样本匹配步骤
首先我们需要理解yolov5网络的预测特征图包含三个尺度,80 * 80、40 * 40和20 * 20。我们可以看成是80 * 80、40 * 40、20 * 20的grid网格,每个网格对应了三个不同尺度的预设anchor。我们在匹配正样本的时候,其实就是把这些网格对应的anchor进行分类,分成正样本或是负样本。
tip:我们可以计算在特征图80 * 80中的总anchor数(也就是正负样本的总数)为3 * 80 * 80 * batchsize,意为(一个网格对应的anchor数)* 特征图的宽高*batchsize,而正样本数往往只有几百个,负样本数为总样本数-正样本数,约有几十万个左右,数量差距非常大。这就是为什么单阶段目标检测需要平衡正负样本策略的原因了。
匹配策略策略具体概括如下:
1.用anchor与gtbox从左上角对齐进行匹配,YOLOv5用到的匹配策略如下:
如果anchor和gtbox的 宽高小于阈值anchor_t(在源码中默认设置为4.0),就算匹配成功。简单理解为其实只要GT Box满足在某个Anchor Template宽和高的×0.25倍和×4.0倍之间就算匹配成功。如下图,AT2和AT3匹配成功

2.将GT投影到对应预测特征层上,根据GT的中心点定位到对应Cell,注意图中有三个对应的Cell。因为网络预测中心点的偏移范围已经调整到了( − 0.5 , 1.5 ),所以按理说只要Grid Cell左上角点距离GT中心点在(−0.5,1.5)范围内它们对应的Anchor都能回归到GT的位置处。这样会让正样本的数量得到大量的扩充。
则这三个cell对应的AT2和AT3都为正样本
还需要注意的是,YOLOv5源码中扩展Cell时只会往上、下、左、右四个方向扩展,不会往左上、右上、左下、右下方向扩展。下面是一些示例:

总体来说,理解anchor-base正负样本匹配策略的关键,其实就是要搞清楚特征图上的grid网格,每个网格都会有预设的anchor,基于anchor与gtbox的iou阈值来定义正样本,只有理解了就很简单,其他anchor-base的方法也是大同小异。后续有空的话打算整理一下anchor free的正负样本匹配策略和一些动态正负样本匹配。
















