mAP

yolov8实例分割mask变透明_卷积

AP就是PR曲线的定积分,即面积
表示avg precision(平均精确率)
mAP就是所有分类的类比的平均值

Focus

Focus用于提高速度,缩小长宽,提升通道数。

yolov8实例分割mask变透明_目标检测_02

Bottleneck

Bottleneck是YOLO系列中最经典的残差结构,用于解决梯度消失和梯度爆炸的问题,它先经过1×1的卷积层,然后再通过3×3的卷积层,最后通过残差结构与初始输入相加。

yolov8实例分割mask变透明_计算机视觉_03


yolov8实例分割mask变透明_计算机视觉_04


参考了resnet模型,然后加入到了yolo中。

总的来说,为了解决模型可能随着层数的增加,越训练越差的问题,该结构就是为了让它保证至少不会越学越差,一旦发现下面两层后的结果不理想,那么就直接让该两层置为0,即不卷积等等,直接让原先层数的特征进入到后面的层当中。

CSP结构

CSP结构解决了网络模型中梯度信息重复的问题
方法:将特征图划分为两个部分,然后通过CSP进行合并

BottleneckCSP结构

这是YOLOv5当中用的结构,Bottleneck在防止网络模型训练当中某一层效果不好产生的梯度消失或者爆炸问题,同时CSP在去除了梯度信息重复,降低了计算量的同时,也丰富了梯度组合。
yolov5采用了两种的CSP结构,第一种主要在Backbone中使用CSP_1(结构图中黄色)其中的Bottleneck就是采用Res 结构,第二种就是在Neck中使用CSP_2(结构图中绿色)其中的Bottleneck没有采用Res 结构。

SPP

SPP是空间金字塔层,它能增加感受野,使模型对于大目标和小目标的检测效果会更好,如图就是设置了三种感受野,通过SPP池化,缩小特征量.

简而言之,就是把原本只分成53×53的矩形框,现在增加了13×13和26×26的多种scale,使模型对于大目标和小目标都能识别,效果更好。

那么从结构图中就能得知,实际上预测大目标,选择13×13,然后26×26在参考了前者的基础上,进而特征提取,也就是对于中等大小的目标进行预测,然后再是52×52,目的是预测更小的目标。

yolov8实例分割mask变透明_目标检测_05


yolov8实例分割mask变透明_卷积_06


yolov8实例分割mask变透明_yolov8实例分割mask变透明_07

卷积核

负责提取图像特征,类似于边缘检测的sabel算子。

池化层

负责对图像特征进行降维,进一步筛选精炼特征。

迁移学习

yolov5s.pt这个模型,本质上就是迁移学习的结果,它是将其他已经训练过的模型,对于该模型在具体项目当中进行训练,进而得出新的模型,好处就是节省算力和时间。