目标检测的评估指标
- 准确率 (Accuracy)、错误率 (Error rate)
- 准确率(Accuracy):
- 错误率(Error rate):
- 混淆矩阵 (Confusion Matrix)
- 精确率(Precision)
- 召回率(Recall)
- 平均正确率(AP)和mean Average Precision(mAP)
- 交除并IoU(Intersection Over Union)
- ROC + AUC
- 非极大值抑制NMS(Non-maximum suppression)
目标检测也叫目标提取,是一种基于目标几何和统计特征的图像分割,它将目标的分割和识别合二为一,其准确性和实时性是整个系统的一项重要能力。
准确率 (Accuracy)、错误率 (Error rate)
准确率(Accuracy):
准确(分类)率=正确预测的正反例数 / 总数
错误率(Error rate):
与正确率相反,描述被分类器错分的比例:
错误(分类)率=错误预测的正反例数/总数 = 1 - 准确(分类)率
准确率一般用来评估模型的全局准确程度。
混淆矩阵 (Confusion Matrix)
混淆矩阵中的横轴是模型预测的类别数量统计,纵轴是数据真实标签的数量统计。
对角线上数字越大越好,在可视化结果中颜色越深,说明模型在该类的预测准确率越高。
按行来看,每行不在对角线位置的就是错误预测的类别。
对角线表示模型预测和数据标签一致的数目,对角线之和除以测试集总数为准确率
准确率=(TP+TN)/(TP+FP+FN+TN),即对角线之和除以测试集总数
精确率(Precision)
分类目标只有两类,计为正样本(positive)和负样本(negtive):
1) True positives(TP): 正样本被正确识别为正样本
2)False positives(FP): 假的正样本,即负样本被错误识别为正样本
3)False negatives(FN):假的负样本,即正样本被错误识别为负样本
4)True negatives(TN): 负样本被正确识别为负样本
被识别为正样本的样本中实际为正样本的比例,即:
精确率Precision=TP/(TP+FP)=TP/N
召回率(Recall)
预测为正样本(positive)的样本中正确的数量除以真正的Positive的数量,即:
Recall=TP/(TP+FN)=TP/P
平均正确率(AP)和mean Average Precision(mAP)
AP是PR(Precision-recall)曲线下的面积,越好的分类器,其AP值越高。
mAP是多个类别AP的平均值,其大小在[0,1]区间,越大越好。
交除并IoU(Intersection Over Union)
评价一个检测算法的两个指标:是否正确预测了框内的类别;预测框和人工标注框的重合程度。
计算:预测的边框和真实的边框的交集和并集的比值
ROC + AUC
ROC(Receiver Operating Characteristic)曲线:
横坐标:假正率(False positive rate, FPR),FPR = FP / [ FP + TN] ,代表所有负 样本中错误预测为正样本的概率,假警报率;
纵坐标:真正率(True positive rate, TPR),TPR = TP / [ TP + FN] ,代表所有正样 本中预测正确的概率,命中率。
ROC曲线有个很好的特性:当测试集中的正负样本的分布变化的时候,ROC曲线能够保持不变。
AUC(Area Under Curve):ROC曲线下的面积。AUC越接近1代表分类器性能越好。
非极大值抑制NMS(Non-maximum suppression)
非极大值抑制是一种去除非极大值的算法。
从多个候选框中保留最优框,对于有重叠的预测框,只保留得分最高的。
方法:
(1)NMS计算出每一个bounding box的面积,然后根据score进行排序,把score最大的bounding box作为队列中首个要比较的对象;
(2)计算其余bounding box与当前最大score与box的IoU,去除IoU大于设定的阈值的bounding box,保留小的IoU得预测框;
(3)然后重复上面的过程,直至候选bounding box为空。
NMS一次处理一个类别。
(对目标检测评估指标的初步认识)