LR analyze
有个很有意思的问题:明明 LR 是用来分类,为什么咱们要叫他 ression 回归??上一章咱们畅通了 LR 算法的数学实践、建模根据、损失函数优化办法等,稍作思考便能够答复这个问题。
这一章咱们将从 LR 模型的评估、模型参数剖析角度剖析 LR。
首先是模型评估:评估一个模型的好坏有很多参考根据,作为一个经典二分类模型,混同矩阵矩阵再适宜不过了。
混同矩阵:
A True Negative TN #正确预测负样本数
B False Negative FN #谬误预测负样本数
C True Postive TP #正确预测正样本数
D False Positive FP #谬误预测正样本数
输出后果比照测试机的 label 值,咱们能够失去 ABCD4 个数据
准确率:(正确预测数)/(所有样本) = (A+C)/(A+B+C+D) #Accuracy
正覆盖率:(正确预测正例数)/(所有正例) = C/(B+C) #Sensitivity
负覆盖率:(谬误预测负例数)/(所有负例) = B/(A+D) #Specificy
Accuracy、Sensitivity、Specificy 这三个指标越高越好