ROC曲线理解

ROC曲线理解,第1张

ROC曲线理解
import numpy as np
from sklearn import metrics
y = np.array([1, 1, 2, 2])
scores = np.array([0.1, 0.4, 0.35, 0.8])
fpr, tpr, thresholds = metrics.roc_curve(y, scores, pos_label=2)
print(fpr)
array([0. , 0. , 0.5, 0.5, 1. ])
print(tpr)
array([0. , 0.5, 0.5, 1. , 1. ])
print(thresholds)
array([1.8 , 0.8 , 0.4 , 0.35, 0.1 ])

以上为源码,理解方式如下:
thresholds:切分点
fpr:伪正类率(False positive rate, FPR),预测为正但实际为负的样本占所有负例样本 的比例,横坐标轴
tpr:真正类率(True positive rate, TPR),预测为正且实际为正的样本占所有正例样本 的比例,纵坐标轴。
pos_label:定义哪个标签为正
举例:第一个切分点是1.8,预测值score》=1.8为正,否则为负,返回[0,0,0,0],对应预测为正且实际为负为0,预测为正且实际为正也为0,因此返回[0,0]
第二个切分点是0.8,预测值score》=0.8为正,否则为负,返回[0,0,0,1],对应预测为正且实际为负为0,预测为正且实际为正是1,占好客户的比例1/2,因此返回[0,0.5]
以此类推。AUC为曲线下的面积


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/4655485.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-11-06
下一篇 2022-11-06

发表评论

登录后才能评论

评论列表(0条)

保存