import numpy as np from sklearn import metrics y = np.array([1, 1, 2, 2]) scores = np.array([0.1, 0.4, 0.35, 0.8]) fpr, tpr, thresholds = metrics.roc_curve(y, scores, pos_label=2) print(fpr) array([0. , 0. , 0.5, 0.5, 1. ]) print(tpr) array([0. , 0.5, 0.5, 1. , 1. ]) print(thresholds) array([1.8 , 0.8 , 0.4 , 0.35, 0.1 ]) 以上为源码,理解方式如下: thresholds:切分点 fpr:伪正类率(False positive rate, FPR),预测为正但实际为负的样本占所有负例样本 的比例,横坐标轴 tpr:真正类率(True positive rate, TPR),预测为正且实际为正的样本占所有正例样本 的比例,纵坐标轴。 pos_label:定义哪个标签为正 举例:第一个切分点是1.8,预测值score》=1.8为正,否则为负,返回[0,0,0,0],对应预测为正且实际为负为0,预测为正且实际为正也为0,因此返回[0,0] 第二个切分点是0.8,预测值score》=0.8为正,否则为负,返回[0,0,0,1],对应预测为正且实际为负为0,预测为正且实际为正是1,占好客户的比例1/2,因此返回[0,0.5] 以此类推。AUC为曲线下的面积
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)