python 分类的accuracy f1

原创

mob64ca12f3496a 2024-09-16 03:27:21 ©著作权

文章标签 Python 数据集 python 文章分类 Python 后端开发

©著作权归作者所有：来自51CTO博客作者mob64ca12f3496a的原创作品，请联系作者获取转载授权，否则将追究法律责任

Python 分类的准确率 (Accuracy) 和 F1 分数

在机器学习和数据科学中，模型的评估指标是至关重要的。准确率（Accuracy）和F1分数（F1 Score）是两个常见的分类模型性能评估指标。本文将探讨这两个指标的定义、使用方法，并提供相应的Python代码示例。

准确率（Accuracy）

准确率是最简单的分类性能指标之一。它的计算方式为正确分类的样本数与总样本数之比。公式如下：

[ \text{Accuracy} = \frac{\text{正确分类的样本数}}{\text{总样本数}} ]

在Python中，我们可以使用scikit-learn库来计算准确率。下面是一个简单的示例：

from sklearn.metrics import accuracy_score
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_iris
from sklearn.ensemble import RandomForestClassifier

# 加载数据集
data = load_iris()
X = data.data
y = data.target

# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# 初始化模型并训练
model = RandomForestClassifier()
model.fit(X_train, y_train)

# 进行预测
y_pred = model.predict(X_test)

# 计算准确率
accuracy = accuracy_score(y_test, y_pred)
print(f'模型的准确率为: {accuracy:.2f}')

在这个示例中，我们使用了鸢尾花数据集来训练一个随机森林分类器，并通过accuracy_score函数计算模型的准确率。

F1 分数

F1分数是一个综合考虑了模型的精确率（Precision）和召回率（Recall）的指标。该指标特别适用于类别不平衡的情况。F1分数的计算公式为：

[ \text{F1 Score} = 2 \times \frac{\text{Precision} \times \text{Recall}}{\text{Precision} + \text{Recall}} ]

在scikit-learn中，我们可以使用f1_score函数来计算F1分数。以下是如何在Python中计算F1分数的示例：

from sklearn.metrics import f1_score

# 计算F1分数
f1 = f1_score(y_test, y_pred, average='weighted')
print(f'模型的F1分数为: {f1:.2f}')

在这个代码片段中，f1_score函数计算了F1分数，并设置average='weighted'以处理多类别分类。

旅行图示例

下面是关于模型评估的一个简单旅程图示例，帮助我们理解模型评估的重要性：

journey
    title 模型评估旅程
    section 数据准备
      数据收集: 5: 参加者
      数据清洗: 4: 参加者
    section 模型训练
      选择算法: 4: 参加者
      模型训练: 5: 参加者
    section 模型评估
      计算准确率: 4: 参加者
      计算F1分数: 5: 参加者