python绘制混淆矩阵

原创

mob649e815a6b81 2023-08-26 14:33:50 ©著作权

文章标签 混淆矩阵正例召回率 文章分类 Python 后端开发

©著作权归作者所有：来自51CTO博客作者mob649e815a6b81的原创作品，请联系作者获取转载授权，否则将追究法律责任

Python绘制混淆矩阵

引言

混淆矩阵是机器学习和统计学中常用的评估模型性能的工具。它用于可视化分类模型的预测结果与实际标签之间的差异。本文将介绍如何使用Python绘制混淆矩阵，并给出相应的代码示例。

什么是混淆矩阵？

混淆矩阵（Confusion Matrix）也称为误差矩阵（Error Matrix），是机器学习中常用的评估分类模型性能的工具。它以表格形式展示了模型的预测结果与实际标签之间的差异。

混淆矩阵通常是一个2x2的矩阵，用于二元分类问题。它包含了四个核心指标：真正例（True Positive，TP）、真负例（True Negative，TN）、假正例（False Positive，FP）和假负例（False Negative，FN）。基于这四个指标，我们可以计算出很多评估指标，如准确率、召回率、精确率和F1-score等。

下面是一个示例的混淆矩阵：

	预测正例	预测负例
实际正例	TP	FN
实际负例	FP	TN

绘制混淆矩阵的代码示例

在Python中，我们可以使用sklearn库来计算和绘制混淆矩阵。首先，我们需要导入相关的库和数据集。

from sklearn.metrics import confusion_matrix
import matplotlib.pyplot as plt
import seaborn as sns

# 导入数据集
from sklearn.datasets import load_iris
iris = load_iris()
X = iris.data
y = iris.target

接下来，我们可以使用confusion_matrix函数来计算混淆矩阵。该函数接受两个参数：实际标签和预测标签。

# 计算混淆矩阵
cm = confusion_matrix(y, y_pred)

然后，我们可以使用heatmap函数来绘制混淆矩阵的热力图。热力图以颜色的形式表示矩阵中的数值大小，可以直观地展示模型的预测结果差异。

# 绘制热力图
plt.figure(figsize=(10, 7))
sns.heatmap(cm, annot=True, cmap="Blues")
plt.xlabel("Predicted")
plt.ylabel("Actual")
plt.title("Confusion Matrix")
plt.show()

运行上述代码，我们将得到一个热力图，如下所示：

Confusion Matrix Heatmap

混淆矩阵的评估指标

混淆矩阵可以帮助我们计算出很多分类模型的评估指标。下面是一些常用的评估指标：

准确率（Accuracy）：模型预测正确的样本占总样本的比例。
召回率（Recall）：真正例占实际正例的比例，衡量模型对正例的识别能力。
精确率（Precision）：真正例占预测正例的比例，衡量模型在预测正例时的准确性。
F1-score：综合了召回率和精确率的指标，用于平衡模型的准确性和召回率。

我们可以使用classification_report函数来计算这些指标。

from sklearn.metrics import classification_report

# 计算评估指标
report = classification_report(y, y_pred)
print(report)

上述代码将打印出各个指标的数值。

结论

混淆矩阵是一种用于评估分类模型性能的工具，能够直观地展示模型的预测结果与实际标签之间的差异

上一篇：进入mysql查询实例名的命令

下一篇：python sys.version_info

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯