python混淆矩阵

原创

mob64ca12e2442a 2024-01-21 06:14:25 ©著作权

©著作权归作者所有：来自51CTO博客作者mob64ca12e2442a的原创作品，请联系作者获取转载授权，否则将追究法律责任

Python混淆矩阵

混淆矩阵是机器学习领域中用来评估分类模型性能的一种常用方法。在Python中，我们可以使用一些库来生成和分析混淆矩阵，如Scikit-learn和Matplotlib。本文将介绍混淆矩阵的概念、生成和可视化方法，并提供相应的Python代码示例。

混淆矩阵概述

混淆矩阵是一个2x2的矩阵，用于可视化分类模型的性能。在混淆矩阵中，列代表预测结果，行代表真实标签。矩阵的四个元素分别是真正例（True Positives，TP）、假正例（False Positives，FP）、真反例（True Negatives，TN）和假反例（False Negatives，FN）。具体定义如下：

TP：模型正确预测为正例的数量
FP：模型错误预测为正例的数量
TN：模型正确预测为反例的数量
FN：模型错误预测为反例的数量

生成混淆矩阵

我们首先需要利用分类模型进行预测，并得到预测结果和真实标签。下面的代码示例使用Scikit-learn库中的confusion_matrix函数生成混淆矩阵：

from sklearn.metrics import confusion_matrix

# 预测结果和真实标签
y_pred = [1, 0, 1, 1, 0, 0, 1, 0, 0, 1]
y_true = [1, 1, 0, 1, 0, 1, 0, 0, 1, 0]

# 生成混淆矩阵
cm = confusion_matrix(y_true, y_pred)
print(cm)

运行上述代码，可以得到以下输出结果：

[[3 2]
 [2 3]]

这个输出表示混淆矩阵的各个元素的值。

可视化混淆矩阵

为了更直观地展示混淆矩阵，我们可以使用Matplotlib库来绘制热力图。下面的代码示例使用Matplotlib的imshow函数和颜色映射表（colormap）来可视化混淆矩阵：

import matplotlib.pyplot as plt
import numpy as np

# 绘制热力图
plt.imshow(cm, cmap=plt.cm.Blues)

# 添加颜色条
plt.colorbar()

# 设置坐标轴标签
tick_marks = np.arange(2)
plt.xticks(tick_marks, ['Negative', 'Positive'])
plt.yticks(tick_marks, ['Negative', 'Positive'])

# 添加标签
thresh = cm.max() / 2.0
for i, j in itertools.product(range(cm.shape[0]), range(cm.shape[1])):
    plt.text(j, i, cm[i, j],
             horizontalalignment="center",
             color="white" if cm[i, j] > thresh else "black")

# 设置其他图形属性
plt.title("Confusion Matrix")
plt.xlabel("Predicted Labels")
plt.ylabel("True Labels")

# 显示图形
plt.show()

运行上述代码，可以得到一张可视化的混淆矩阵：

Confusion Matrix