关于程序员:面积曲线AUCarea-under-curve

28次阅读

共计 622 个字符,预计需要花费 2 分钟才能阅读完成。

原文链接

1 ROC

首先介绍 ROC。ROC 剖析是从医疗剖析畛域引入了一种新的分类模型 performance 评判办法。

ROC 的全名叫做 Receiver Operating Characteristic,其次要剖析工具是一个画在二维立体上的曲线——ROC curve。立体的横坐标是 false positive rate(FPR),纵坐标是 true positive rate(TPR)。对某个分类器而言,咱们能够依据其在测试样本上的体现失去一个 TPR 和 FPR 点对。这样,此分类器就能够映射成 ROC 立体上的一个点。调整这个分类器分类时候应用的阈值,咱们就能够失去一个通过 (0, 0),(1, 1) 的曲线,这就是此分类器的 ROC 曲线。个别状况下,这个曲线都应该处于 (0, 0) 和(1, 1)连线的上方。因为 (0, 0) 和(1, 1)连线造成的 ROC 曲线实际上代表的是一个随机分类器。尽管,用 ROC curve 来示意分类器的 performance 很直观好用。可是,人们总是心愿能有一个数值来标记分类器的好坏。于是 Area Under roc Curve(AUC)就呈现了。

2 AUC

AUC 是一种用来度量分类模型好坏的一个规范。顾名思义,AUC 的值就是处于 ROC curve 下方的那局部面积的大小。通常,AUC 的值介于 0.5 到 1.0 之间,较大的 AUC 代表了较好的 performance。

AUC 的计算方法总结:

AUC 的值就是计算出 ROC 曲线上面的面积

 
 

学习更多编程常识,请关注我的公众号:

代码的路

正文完
 0