原文链接
1 ROC
首先介绍 ROC。ROC 剖析是从医疗剖析畛域引入了一种新的分类模型 performance 评判办法。
ROC 的全名叫做 Receiver Operating Characteristic,其次要剖析工具是一个画在二维立体上的曲线——ROC curve。立体的横坐标是 false positive rate(FPR),纵坐标是 true positive rate(TPR)。对某个分类器而言,咱们能够依据其在测试样本上的体现失去一个 TPR 和 FPR 点对。这样,此分类器就能够映射成 ROC 立体上的一个点。调整这个分类器分类时候应用的阈值,咱们就能够失去一个通过 (0, 0),(1, 1) 的曲线,这就是此分类器的 ROC 曲线。个别状况下,这个曲线都应该处于 (0, 0) 和(1, 1)连线的上方。因为 (0, 0) 和(1, 1)连线造成的 ROC 曲线实际上代表的是一个随机分类器。尽管,用 ROC curve 来示意分类器的 performance 很直观好用。可是,人们总是心愿能有一个数值来标记分类器的好坏。于是 Area Under roc Curve(AUC)就呈现了。
2 AUC
AUC 是一种用来度量分类模型好坏的一个规范。顾名思义,AUC 的值就是处于 ROC curve 下方的那局部面积的大小。通常,AUC 的值介于 0.5 到 1.0 之间,较大的 AUC 代表了较好的 performance。
AUC 的计算方法总结:
AUC 的值就是计算出 ROC 曲线上面的面积
学习更多编程常识,请关注我的公众号:
代码的路