soft回归

转载

mob64ca13f8b166 2024-09-23 13:30:46

文章标签 soft回归逻辑回归机器学习算法正例 文章分类 机器学习人工智能

soft回归_机器学习

同样使用梯度下降优化算法，去减少损失函数的值，这样去更新逻辑回归前面对应算法的权重参数，提升原本属于1类别的概率，降低原本是0类别的概率

逻辑回归API

sklearn.linear_model.LogisticRegression(solve='libinear', penalty='12', C= 1.0)

solver:优化求解方式（默认开源的liblinear库实现，内部使用了坐标轴下降法来迭代优化损失函数）
sag 根据数据集自动选择，随机平均梯度下降
penalty 正则化的种类
C 正则化力度

（默认将类别数量少的当做正例）

LogisticRegression方法相当于SGDClassifier（loss=‘log’，penalty=""）,SGDClassifier实现了一个普通的随机梯度下降学习，也支持平均随机梯度下降法（ASGD），也可以通过设置average=True，而使用LogisticRegression（实现了SAG）

import pandas as pd
import numpy as np
# 1 读取数据
path = "https://archive.ics.uci.edu/ml/machine-learning-databases/"
column_name = [1,2,3,4,5,6,7,8,9]
data = pd.read_csv(path, names=column_name)

jupyter 代码截图运行如下

为什么代码写一点点就开始截图呢

因为wotailanle

soft回归_逻辑回归_02

soft回归_算法_03

soft回归_正例_04

soft回归_soft回归_05

soft回归_机器学习_06

soft回归_算法_07

精确率与召回率

精确率预测结果为正中真实为正例的比例

召回率真实为正例的样本中预测结果为正例的比例

（其他预估标准，F1-score，反映了模型的稳健性）

分类评估报告API

sklearn.metrics.classificaction_report(y_true,y_predict,labels=[],target_names=None)

y_true 真实标准值
y_predict 估计器预测目标值
labels 指定类别对应的数字
target_names 目标类别的名字
return 每个类别精确率与召回率

# 查看精确率、召回率、F1-score
from sklearn.metrics import classification_report
report = classification_report(y_test, y_predict, labels=[2,4], target_names=["良性", "恶性"])
print(report)

precision recall f1-score support 良性 1.00 0.97 0.99 103 恶性 0.96 1.00 0.98 68 accuracy 0.98 171 macro avg 0.98 0.99 0.98 171 weighted avg 0.98 0.98 0.98 171

Roc AUC曲线