乐趣区

关于深度学习:MindSpore分类指标之精准率召回率和F值详解二

一、精准率和召回率

在上次的分享中,咱们提到了评测分类模型的意义和准确率、AUC/ROC 两种评测办法。敌人们可能就会思考分类的工作多种多样,评测模型的性能只有这两种办法吗?当然还有。这次咱们就一起来认识一下精准率(Precision)、召回率(Recall),以及这两个联合组成的 F 值。

咱们还是通过混同矩阵来示意:

1.png

图 1 - 混同矩阵

精准率

咱们从表达式开始:

2.png

图 2 - 精准率表达式

联合混同矩阵和表达式来了解,首先从分母开始(TP+FP),在分类工作中的意义是预测为正类的样本数量,分子的意义是样本类别理论为正并被预测为正的数量,它们两个的比值咱们称为精准率,精准率是针对预测后其中一个类别的评测表达式。

这里咱们重点辨别一下和精准率 (Precision) 准确率(Accuracy),因为这两个名词的概念很容易凌乱。

3.png

图 3 - 精准率和准确率

通过比照咱们可能发现,准确率的分母更大,作用域更广,精准率的分母小一些,作用域也小一些。所以作用更精准。

召回率

上面咱们看召回率的表达式:

4.png

图 4 - 召回率表达式

在表达式中的分母(TP+FN),联合混同矩阵能够晓得代表的是实在类别为某一个类别的样本数量,分子则是实在类别与预测类别雷同的样本数量。

二、精准率和召回率场景剖析

在检索畛域中,精准率和召回率又被称为查准率和查全率。咱们联合一下事实场景来理解一下查准率和查全率的现实意义。

举例说明

假如明天放假了,好开心啊!买一包瓜子庆贺一下。假期里好无聊啊,将这一包瓜子拆开数一数有多少颗瓜子,一共 1000 颗瓜子。展现分类能力的时候到了,通过瓜子的各种特色,将全副的瓜子分成了 800 颗‘好’瓜子和 200 颗‘坏’瓜子两个类别。终于到了验证本人分类能力的时候了。将这两个类别的瓜子一个一个嗑开吃掉发现,在这一堆 800 个‘好’的瓜子中,有 750 个是真正好的,200 颗‘坏’瓜子中有 100 个真正坏的瓜子。

那么咱们能够晓得了 1000 个瓜子中有 750+(200-100)=850 个好瓜子。应用精准率就是(750/800),现实意义能够了解为:在咱们分类好的一类样本中,有多少是实在属于这一类别,因而精准率也能够称为查准率。应用召回率能够示意为(750/(750+100)),现实意义就能够了解为:在某一类的样本中在分类后,仍旧被分为这一类别,所以也示意一类样本有多少被召回到原类别中,因而也能够称为召回率。

举荐零碎中的应用

因为这两种指标的性质,也会常常利用到举荐零碎我的项目中,比方一个简略的音乐举荐零碎,在积攒够一定量的用户数据后,咱们就能够依据用户的历史记录做画像。(如果数据不够,这就是冷启动问题了,冷启动的解决办法有很多种,这里就不过多拓展了,持续直奔咱们的主题)用户画像实现后,就该进行召回过程了,(这里的召回是依据用户画像在海量的音乐数据中将用户可能喜爱的音乐找进去,放入召回池中。这一过程称为召回)那么这里就能够用到精准率和召回率了。在这种场景下,精准率示意:在召回池的这批音乐中有多少是我喜爱的。召回率示意:在所有我喜爱的音乐中,有多少被召回了。当然在这种状况下,如果这两个指标的值越大,阐明这个举荐零碎越优良。

三、F 值

下面咱们曾经大抵理解了精准率 (Precision) 和召回率(Recall)。那么咱们能够再思考一下,精准率高的时候召回率就高吗?召回率高的时候精准率就高吗?后果咱们会发现,这两个并没有太大的关系,所以无论繁多的应用其中的哪一个指标,都是不全面的。那么咱们就开始合体了。

5.png

图 5 - F 值公式

所以在精准率和召回率呈现矛盾状况的时候,咱们就须要综合思考它们,最常见的办法就是 F -Measure。当参数 α = 1 时,就是最常见的 F1,公式示意为:
6.png

图 6 -F1 值公式

F1 分数是精准率和召回率的谐波平均值,而谐波平均值会给予较低的值更高的权重。因而,当召回率和精准度都很高时,分类器能力失去较高的 F1 分数。

四、总结

通过对下面三种分类指标的剖析,咱们会发现每个表达式都各有优劣,重要的是须要联合应用场景来抉择应用。比方咱们要对一批疑似患传染病的人群进行体检,那么这种状况咱们就要将召回率放在第一位了。如果在一些视频、音乐举荐中,就会将精准率作为规范。所以在大家理解完它们的个性后,明确怎么去抉择应用就是本篇文章的次要目标。

以上内容是集体的一些了解,心愿大家多多斧正探讨!

退出移动版