一、NMS

非极大值抑制用在最后阶段,即所有边界框都已经回归调整过后,对图片每一类使用NMS防止一个目标出现多个边界框。
1、非极大值抑制需要设置一个阈值
2、使用时间是最后调整完预测框位置后
3、多少个类就使用多少次非极大值抑制
3、每一类使用非极大值抑制后找到所有这类的边界框
添加链接描述

二、置信度

置信度用来判断边界框内的物体是正样本还是负样本,大于置信度阈值的判定为正样本,小于置信度阈值的判定为负样本即背景。

三、IOU(交并比)

1、IOU被用来判断bbox是正样本还是负样本。

置信度和IOU一起用来计算精确率(查确率,所有判断的目标中判断正确的比例,分类器认为是正类并且确实是正类的部分占所有分类器认为是正类的比例)TP/TP+FP和召回率(查全率,所有目标中被检测到的目标比例,分类器认为是正类并且确实是正类的部分占所有确实是正类的比例)TP/TP+FN

精确率就是判断为正样本中实际为正样本的概率,召回率就是所有真实样本中被找到为正样本的概率。

当通过IOU判断是正样本的情况属于P当通过confidence阈值判断的正样本属于T,所以如果IOU判断是正样本且confidence也判断是正样本时属于TP,这时剩下的实际的GT但置信度却小于confidence阈值的被认为是FN。

机器学习ocr文本检测置信度 目标检测置信度_ide


机器学习ocr文本检测置信度 目标检测置信度_召回率_02

计算AP(平均精确率),是针对每一类来说的,先将每类预测框按照置信度从大到小依次排序,再依次计算出精确率和召回率,然后画出PR曲线图,图下的面积就是该类别的AP。

机器学习ocr文本检测置信度 目标检测置信度_ide_03


注意这里所有的bbox都是经过NMS之后得到的。

所有类的AP求平均就是MAP。

添加链接描述添加链接描述