python画混淆矩阵代码

原创

mob64ca12e4972a 2024-09-28 04:01:23 ©著作权

文章标签 混淆矩阵数据集 python 文章分类 Python 后端开发

©著作权归作者所有：来自51CTO博客作者mob64ca12e4972a的原创作品，请联系作者获取转载授权，否则将追究法律责任

使用Python绘制混淆矩阵的完整指南

一、前言

在机器学习中，混淆矩阵是评估分类模型性能的重要工具。它通过显示真实标签和预测标签的对比信息，帮助我们快速了解模型的分类效果。本文将引领你从零开始实现一个简单的混淆矩阵绘制程序。

二、整体流程

下面的表格概述了整个实现过程的步骤。

步骤	描述
1	导入所需的库
2	加载数据
3	训练模型
4	生成预测
5	计算混淆矩阵
6	绘制混淆矩阵

三、流程详解

1. 导入所需的库

首先，需要使用几个Python库。其中，numpy和matplotlib用于数据处理和图形绘制，sklearn库用于混淆矩阵的计算。

import numpy as np            # 用于数组处理
import matplotlib.pyplot as plt # 用于绘制图形
from sklearn.metrics import confusion_matrix, ConfusionMatrixDisplay # 用于计算和显示混淆矩阵
from sklearn.model_selection import train_test_split # 用于划分数据集
from sklearn.datasets import load_iris # 用于加载数据集
from sklearn.linear_model import LogisticRegression # 用于构建模型

2. 加载数据

这里我们使用Iris数据集作为例子，它是一个经典的机器学习数据集。

# 加载Iris数据集
data = load_iris()
X = data.data      # 特征
y = data.target    # 标签

3. 训练模型

接下来，我们将数据集分为训练集和测试集，并训练一个逻辑回归模型。

# 划分数据集，75%训练，25%测试
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25, random_state=42)

# 创建逻辑回归模型并进行训练
model = LogisticRegression(max_iter=200) # max_iter用于确保模型收敛
model.fit(X_train, y_train) # 训练模型

4. 生成预测

模型训练完成后，我们需要使用测试集进行预测。

# 生成预测
y_pred = model.predict(X_test) # 预测测试集

5. 计算混淆矩阵

接下来，利用sklearn库计算混淆矩阵。

# 计算混淆矩阵
cm = confusion_matrix(y_test, y_pred) # 真实标签和预测标签的混淆矩阵
print(cm) # 打印混淆矩阵

6. 绘制混淆矩阵

最后，使用matplotlib绘制混淆矩阵。

# 绘制混淆矩阵
disp = ConfusionMatrixDisplay(confusion_matrix=cm, display_labels=data.target_names)
disp.plot(cmap=plt.cm.Blues) # 使用蓝色调的配色
plt.title('Confusion Matrix') # 标题
plt.show() # 显示图形

四、旅行图

在我们的学习过程中，我们可以使用Mermaid的旅程图来展示学习的旅程：

journey
    title 混淆矩阵学习之旅
    section 导入库
      导入numpy和matplotlib: 5: 否
      导入sklearn库: 4: 否
    section 加载数据
      加载数据集: 5: 否
    section 训练模型
      数据集划分: 5: 否
      训练模型: 5: 否
    section 生成预测
      使用模型预测: 5: 否
    section 计算混淆矩阵
      计算混淆矩阵: 5: 否
    section 绘制混淆矩阵
      使用matplotlib绘制: 5: 否