AUC的计算方法总结 (2)



AUC的计算方法总结

另外,特别需要注意的是,再存在score相等的情况时,对相等score的样本,需要 赋予相同的rank(无论这个相等的score是出现在同类样本还是不同类的样本之间,都需要这样处理)。具体操作就是再把所有这些score相等的样本 的rank取平均。然后再使用上述公式。 

------------------------------------------------------------------------ 
ROC(Receiver Operating Characteristic)曲线,用于二分类判别效果的分析与评价.一般自变量为连续变量,因变量为二分类变量. 
基 本原理是:通过判断点(cutoff point/cutoff value)的移动,获得多对灵敏度(sensitivity)和误判率(1-Specificity(特异度)),以灵敏度为纵轴,以误判率为横轴,连 接各点绘制曲线,然后计算曲线下的面积,面积越大,判断价值越高. 
灵敏度:就是把实际为真值的判断为真值的概率. 
特异度:就是把实际为假值的判断为假值的概率. 
将绘成的曲线与斜45度的直线对比,若差不多重合,说明自变量对因变量的判断价值很差,若越远离斜45度的直线即曲线下的面积越大,说明自变量对因变量的判断价值越好,即根据自变量可以较为正确的判断因变量. 
使用SPSS的操作过程如下: 
Graphs/ROC Curve:Test variable选自变量(连续型变量),state varibale选因变量(二分类变量)display的选项一般全选. 
运行结果:1.ROC曲线,可直观地看到曲线形状. 
2.Area under the curve:曲线下方的面积,包括面积值,显著性分析,置信区间. 
3.Coordinates of the curve:ROC曲线各点对应的灵敏度和误判率.

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/zzfdgx.html