Confusion matrix

原创

李响Superb 2022-03-02 09:26:54 ©著作权

©著作权归作者所有：来自51CTO博客作者李响Superb的原创作品，请联系作者获取转载授权，否则将追究法律责任

模型评估之混淆矩阵（confusion_matrix）
TP(True Positive)：将正类预测为正类数，真实为0，预测也为0
FN(False Negative)：将正类预测为负类数，真实为0，预测为1
FP(False Positive)：将负类预测为正类数，真实为1，预测为0
TN(True Negative)：将负类预测为负类数，真实为1，预测也为1
混淆矩阵定义及表示含义

混淆矩阵是机器学习中总结分类模型预测结果的情形分析表，以矩阵形式将数据集中的记录按照真实的类别与分类模型预测的类别判断两个标准进行汇总。其中矩阵的行表示真实值，矩阵的列表示预测值，下面我们先以二分类为例，看下矩阵表现形式，如下：
Confusion matrix_C
现在我们举个列子，并画出混淆矩阵表，假如宠物店有10只动物，其中6只狗，4只猫，现在有一个分类器将这10只动物进行分类，分类结果为5只狗，5只猫，那么我们画出分类结果混淆矩阵，并进行分析，如下（我们把狗作为正类）：
Confusion matrix_二分类_02
通过混淆矩阵我们可以轻松算的真实值狗的数量（行数量相加）为6=5+1，分类得到狗的数量（列数量相加）为5=5+0,真实猫的数量为4=0+4，分类得到猫的数量为5=1+4。同时，我们不难发现，对于二分类问题，矩阵中的4个元素刚好表示TP,TN,FP,TN这四个符号量，如下图：
Confusion matrix_混淆矩阵_03
那么对于二分类问题来说，精确率Precision=a/(a+c)=TP/(TP+FP),召回率recall=a/(a+b)=TP/(TP+FN),准确率accuracy=(a+d)/(a+b+c+d)=(TP+FN+FP+TN),可以看到准确率中的分子值就是矩阵对角线上的值。