关于paddle:CVPR-2023-单阶段半监督目标检测SOTAARSL

本文提出了针对单阶段半监督指标检测工作的Ambiguity-Resistant Semi-supervised Learning（ARSL）算法，翻新地提出了两个通用的单阶段半监督检测模块：Joint-Confidence Estimation（JCE）和Task-Separation Assignment（TSA）。JCE通过联结分类和定位工作的置信度评估伪标签品质。TSA基于老师模型预测的联结置信度将样本划分为正样本、负样本和不置可否的候选样本，并进一步在候选样本中别离为分类、定位工作筛选潜在正样本。

背景及动机

基于深度学习的指标检测算法通常依赖大规模标注数据能力施展出最大的威力。为了节俭标注人力，升高数据标注老本，半监督指标检测（SSOD）应运而生。半监督指标检测旨在利用大量的标注数据和大量的无标注数据进行模型训练，在最新进展中，其次要依赖于Mean-Teacher框架以及Pseudo-labeling技术，即用老师模型在无标注数据上生成的伪标签（Pseudo labels）训练学生模型，再基于学生模型在时序上的权重均值来更新老师模型。
图1.在根底半监督框架下，单阶段检测器（FCOS）的晋升弱于两阶段办法（Faster RCNN）然而基于该流程，咱们发现相比于两阶段检测器（如Faster RCNN），单阶段检测算法（如 FCOS）仅能获得绝对无限的晋升。是什么限度了单阶段检测器的半监督训练？ 通过定量分析，咱们发现单阶段检测器的伪标签中存在重大的筛选歧义性（Selection Ambiguity）及样本调配歧义性（Assignment Ambiguity）。

.png”)
表1. (筛选歧义性) 伪标签的品质剖析

.png”)
图2. (调配歧义性) 不同阈值下，样本调配的正确性

筛选歧义性是指，因为检测后果的分类置信度和定位品质并不匹配，使得基于分类得分筛选的伪标签不够精确。这一点在单阶段检测器中更加重大。表1中能够看到，相比于Faster RCNN，FCOS预测的检测后果中，分类得分和定位品质的相关性更低。换句话说，FCOS筛选高质量伪标签的能力更弱。

调配歧义性是指，基于伪标签的样本调配中，大量样本被调配了谬误的标签。问题的本源在于，FCOS的调配策略间接将边界框外部（或核心区域）的样本划分为正样本，而疏忽了伪标签的边界框并不精确。这使得大量的背景区域被当成了正样本（False Positive），同时被阈值过滤掉的物体也被划分为了负样本（False Negative）。如图2所示，不论伪标签的筛选阈值如何设置，调配后果中均存在大量的false positive和false negative。能够看出，基于边界框的样本调配策略（如 FCOS 的 center sampling）在伪标签调配上存在着人造的劣势。另外，相比于Faster RCNN，FCOS等单阶段检测器须要像素级的样本标签，因而对调配歧义性更加敏感。

算法简介

为了解决上述问题，咱们提出了Ambiguity-Resistant Semi-supervised Learning（ARSL），包含Joint-Confidence Estimation（JCE）和Task-Separation Assignment（TSA），通用于单阶段半监督指标检测工作。

.png”)
图3. ARSL 框架图。对于无标签数据，老师模型首先通过JCE预测样本的联结置信度。而后，TSA基于置信度将样本划分为正样本、负样本和不置可否的候选样本，并进一步为分类、定位工作筛选潜在正样本。

针对伪标签的筛选歧义性，JCE基于分类工作和定位工作的联结置信度来评估伪标签的品质。更为具体地，JCE通过双分支构造，同时预测分类得分和定位品质，并将两者的乘积作为联结置信度。为了防止两个分支独自训练所导致的次优状态，对于标注数据，两者应用IoU-based soft label进行联结训练；对于无标注数据，间接应用老师模型联结置信度的最大响应值进行训练。

.png”)
图4. JCE 示意图

.png”)
图5. 正负样本在联结置信度区间中的散布

针对伪标签的调配歧义性，TSA摒弃了box-based assignment，基于老师模型在每个样本点上预测的联结置信度，间接对其进行正负样本划分。然而如上图5所示，处于置信度两头区域的样本仍然是难以抉择的。为此，TSA首先应用基于统计信息的双阈值将样本分为负样本、正样本和不置可否的候选样本，而后在候选样本中别离为分类工作和定位工作进一步筛选潜在正样本。候选样本次要由低置信度的正样本和艰难负样本组成，并不是单纯的背景区域（均匀IoU为0.369）。对于分类工作，这些样本都值得学习，因而所有候选样本都参加老师模型的一致性学习，间接模拟老师模型预测的概率分布。而定位工作对样本的抉择更加刻薄，差异性过大会导致定位工作不收敛。因而，TSA通过评估候选样本于正样本的相似性来筛选潜在正样本（类别相似性、定位相似性、几何地位相似性），并应用正样本边界框的加权值作为潜在正样本的学习指标。

试验成果

与半监督检测SOTA 的比照

.png”)

在COCO-Standard 1%，2%，5%，10% split中（应用1%,2%, 5%,10% 的COCO_train2017标注数据进行监督训练，残余作为无标注数据进行半监督训练，每个split均采样5组数据），ARSL均高于以后的SOTA算法，减少大尺度抖动（large-scale jittering）后进一步拉大了差距。

在COCO-Full中（应用全副的COCO_train2017标注数据进行监督训练，COCO_unlabel2017作为无标注数据），ARSL在较短的训练周期下获得了更加显著的晋升。

融化性剖析

.png”)

表5.能够看到，FCOS在根底的半监督框架下仅获得了4.7%AP的晋升（26.0%->30.7%），而基于ARSL则进一步晋升了6.2%AP达到了36.9%AP。其中，JCE和TSA别离涨点4.0%AP，2.2%AP。表6为JCE中各个策略的晋升成果。

歧义性打消的验证剖析

.png”)

表8. 筛选歧义性

.png”)

图6. 调配歧义性

表8.通过定量分析验证了JCE能够筛选出更高质量的伪标签，从而晋升半监督学习的成果。图6.剖析验证了TSA中样本标签调配的正确性。具体来说，TSA w/o mining将True Positive的数量晋升了111.4%，还额定缩小23.4%的False Positive。进一步筛选潜在正样本（Mining）能够将True Positive的数量晋升至169.8%。

对于本篇ARSL欢送大家入群探讨，也欢送大家在GitHub点star反对咱们的工作！

.png”)

相干链接

.png”)

论文地址

https://arxiv.org/abs/2303.14960

代码地址

https://github.com/PaddlePaddle/PaddleDetection/tree/develop/configs/semi_det

关于paddle:CVPR-2023-单阶段半监督目标检测SOTAARSL

背景及动机

算法简介

试验成果

与半监督检测SOTA 的比照

融化性剖析

歧义性打消的验证剖析

评论

发表回复取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

关于paddle:CVPR-2023-单阶段半监督目标检测SOTAARSL

背景及动机

算法简介

试验成果

与半监督检测SOTA 的比照

融化性剖析

歧义性打消的验证剖析

评论

发表回复 取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

发表回复取消回复