YOLO模型 lua

转载

mob64ca13ff5b03 2025-07-25 13:21:44

文章标签 YOLO模型 lua #YOLO #深度学习 #人工智能宽高 文章分类 游戏开发

YOLOv5的正负样本匹配策略

关于YOLOv5的正负样本匹配策略网上已经有很多参考资料了，推荐大家先看一下这一篇：

这位博主讲得十分详细了，我这里结合我个人的一些理解对YOLOv5的正样本匹配策略进行一些补充：

正样本匹配步骤

首先我们需要理解yolov5网络的预测特征图包含三个尺度，80 * 80、40 * 40和20 * 20。我们可以看成是80 * 80、40 * 40、20 * 20的grid网格，每个网格对应了三个不同尺度的预设anchor。我们在匹配正样本的时候，其实就是把这些网格对应的anchor进行分类，分成正样本或是负样本。

tip：我们可以计算在特征图80 * 80中的总anchor数（也就是正负样本的总数）为3 * 80 * 80 * batchsize，意为（一个网格对应的anchor数）* 特征图的宽高*batchsize，而正样本数往往只有几百个，负样本数为总样本数-正样本数，约有几十万个左右，数量差距非常大。这就是为什么单阶段目标检测需要平衡正负样本策略的原因了。

匹配策略策略具体概括如下：

1.用anchor与gtbox从左上角对齐进行匹配，YOLOv5用到的匹配策略如下：

如果anchor和gtbox的宽高小于阈值anchor_t（在源码中默认设置为4.0），就算匹配成功。简单理解为其实只要GT Box满足在某个Anchor Template宽和高的×0.25倍和×4.0倍之间就算匹配成功。如下图，AT2和AT3匹配成功

YOLO模型 lua_#人工智能

2.将GT投影到对应预测特征层上，根据GT的中心点定位到对应Cell，注意图中有三个对应的Cell。因为网络预测中心点的偏移范围已经调整到了( − 0.5 , 1.5 )，所以按理说只要Grid Cell左上角点距离GT中心点在(−0.5,1.5)范围内它们对应的Anchor都能回归到GT的位置处。这样会让正样本的数量得到大量的扩充。

则这三个cell对应的AT2和AT3都为正样本

还需要注意的是，YOLOv5源码中扩展Cell时只会往上、下、左、右四个方向扩展，不会往左上、右上、左下、右下方向扩展。下面是一些示例：

YOLO模型 lua_宽高_02

总体来说，理解anchor-base正负样本匹配策略的关键，其实就是要搞清楚特征图上的grid网格，每个网格都会有预设的anchor，基于anchor与gtbox的iou阈值来定义正样本，只有理解了就很简单，其他anchor-base的方法也是大同小异。后续有空的话打算整理一下anchor free的正负样本匹配策略和一些动态正负样本匹配。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。