找到一篇论文代码浮现的时候人家用matplotlib画图。。。但是这个图片虽然美观但是到底是没有那一串串数字吸引人,比如这样的
然后我就把它改了,记录一下
from sklearn.metrics import precision_recall_curve
from sklearn.metrics import f1_score
from sklearn.metrics import precision_recall_curve
from sklearn.metrics import roc_auc_score, precision_recall_curve, roc_curve, auc, confusion_matrix
precision, recall, _ = precision_recall_curve(y_label, y_pred)
# ROC-AUC
print(roc_auc_score(y_label, y_pred))
# PR-AUC
print(auc(precision, recall))
# F1
print(f1_score(y_label, y_pred))
我不想知道这些怎么算的,建议不要和我学,还是要发扬一下刨根问底的求知精神。
额,bug
出现问题,还得是学习一下这些怎么是什么意思:在此总结
fpr, tpr, thresholds = roc_curve(y_label, y_pred)
roc_curve 是画ROC曲线的,三个返回值
fpr = false positive rate
tpr = true positive rate
thresholds 阈值
ROC曲线的横纵坐标就是fpr tpr,PR、ROC、AUC全击破 - 知乎
最上面那个代码,roc_auc_score计算没有问题,pass
PR AUC计算出现问题ROC-AUC 与 PR-AUC 的区别与联系 - 知乎
横纵坐标分别是recall ,precision
#ROC AUC
print(roc_auc_score(y_label, y_pred))
#PR AUC
precision, recall, _ = precision_recall_curve(y_label, y_pred)
print(auc(recall, precision))
Recall在前,precision在后就对了
最后F1score报错了。。。
没搜到。。
发现问题是我太傻了,预测值我怎么给个连续的呢。。。
很明显要给个阈值呀
#F1
print(f1_score(y_label, [1 if i > 0.6 else 0 for i in y_pred], average="micro"))
这样就好了。
之前sklearn安装时候出现了这个问题
python的包真好用