关于机器学习:DW优化目标检测训练过程更全面的正负权重计算-CVPR-2022

46次阅读

共计 4071 个字符，预计需要花费 11 分钟才能阅读完成。

论文提出自适应的 label assignment 办法 DW，突破了以往耦合加权的常规。依据不同角度的一致性和非一致性指标，动静地为 anchor 调配独立的 pos 权重和 neg 权重，能够更全面地监督训练。此外，论文还提出了新的预测框精调操作，在回归特色图上间接精调预测框

起源：晓飞的算法工程笔记公众号

论文:A Dual Weighting Label Assignment Scheme for Object Detection

论文地址：https://arxiv.org/abs/2203.09730
论文代码：https://github.com/strongwolf/DW

Anchor 作为指标检测器训练的根底单元，须要被赋予正确的分类标签和回归标签，这样的标签指定 (LA, label assignment) 过程也可认为是损失权重指定过程。对于单个 anchor 的 cls 损失计算，能够对立地示意为：

$w_{pos}$ 和 $w_{neg}$ 为正向权重和反向权重，用于管制训练的方向。基于这个设计，能够将 LA 办法分为两个大类：

Hard LA：每个 anchor 都可被分为 pos 或 neg，即 $w_{pos},w_{neg}\in \{0,1\}$ 以及 $w_{pos}+w_{neg}=1$，这类办法的外围在于找到辨别正负 anchor 的界线。经典的做法间接采纳固定的 IoU 阈值进行判断，疏忽了指标在大小和形态上的差别。而近期如 ATSS 等钻研则提出动静阈值的概念，依据具体的 IoU 散布来划分 anchor。但对于训练来说，不论是动态还是动静的 Hard LA 办法，都疏忽了 anchor 自身的重要性差别。

Soft LA：为了克服 Hard LA 的毛病，GFL 和 VFL 等钻研提出了 soft 权重的概念。这类办法基于 IoU 为每个 anchor 设定 soft label 指标，并且依据 cls 分数和 reg 分数为 anchor 计算 $w_{pos}$ 和 $w_{neg}$。但目前这些办法都专一于 $w_{pos}$ 的设计，$w_{neg}$ 个别间接从 $w_{pos}$ 中衍生而来，导致网络短少来自于 neg 权重的监督信息。如图 1 所示，GFL 和 VFL 为品质不同的 anchor 赋予类似的损失权重，这可能会升高检测器的性能。

为了给检测器提供更多的监督信息，论文提出了新的 LA 办法 DW(dual weighting)，从不同的角度独自计算 $w_{pos}$ 和 $w_{neg}$ 并让其可能互补。此外，为了给权重计算函数提供更精确的 reg 分数，论文还提出了新的 bbox 精调操作，预测指标的边界地位并依据对应的特色产生更精确的精调信息。

因为 NMS 的存在，检测器应该预测统一的 bbox，既有高分类分数也有精确的地位定位。但如果在训练时平等地看待所有的训练样本，而 cls 分数越高的预测后果的 reg 地位不肯定越精确，这往往会导致 cls head 与 reg head 之间就会存在不一致性。为此，Soft LA 通过加权损失来更柔和地看待训练样本，增强 cls head 与 reg head 的一致性。基于 Soft LA，anchor 的损失能够示意为：

其中 $s$ 为预测的 cls 分数。为一致性更高的预测后果调配更大的 $w_{pos}$ 和 $w_{reg}$，可能使得网络专一于学习高质量的预测后果，加重 cls head 与 reg head 的不统一问题。

以后的办法间接将 $w_{reg}$ 设置为 $w_{pos}$，次要关注如何定义一致性以及如何将其集成到损失权重中。表 1 总结了一些办法对 $w_{pos}$ 和 $w_{neg}$ 的计算公式，这些办法先定义用于度量一致性的指标 $t$，随后将 $1-t$ 作为不一致性的度量指标，最初增加缩放因子将指标集成到损失权重中。
上述办法的 $w_{pos}$ 和 $w_{neg}$ 都是高度相干的，而论文认为 pos 和 neg 权重应该以 prediction-aware 的形式独自设置，具体如下：

pos weighting function：以预测的 cls 分数和预测框的 IoU 作为输出，预测两者的一致性水平作为 pos 权重。
neg weighting function：同样以预测 cls 分数和预测框的 IoU 作为输出，但将 neg 权重定义为 anchor 为负的概率以及 anchor 作为负的重要水平的乘积。

通过上述定义，对于 pos 权重类似的这种不置可否的 anchor，就能够依据不同的 neg 权重失去更细粒度的监督信息。

DW 办法的整体流程如图 2 所示，先依据中心点间隔来为每个 GT 结构候选正样本集，其余的 anchor 为候选负样本。因为负样本的统计信息非常凌乱，所以不参加权重函数的计算。候选正样本会被赋予三个权重 $W_{pos}$、$W_{neg}$ 以及 $W_{reg}$，用于更无效地监督训练。

pos 权重须要反映预测后果对检测性能的重要性，论文从指标检测的验证指标来剖析影响重要性的因素。在测试时，通常会依据 cls 分数或 cls 分数与 IoU 的联合对单分类的预测后果进行排序，从前往后顺次判断。正确的预测需满足以下两点：

a. 与所属 GT 的 IoU 大于阈值 $\theta$。
b. 无其余排名靠前且所属 GT 雷同的预测后果满足条件 a。

上述条件可认为是抉择高 ranking 分数以及高 IoU 的预测后果，也意味着满足这两个条件的预测后果有更大概率在测试阶段被抉择。从这个角度来看，pos 权重 $w_{pos}$ 就应该与 IoU 和 ranking 分数正相干。首先定义一致性指标 $t$，用于度量两个条件的对齐水平：

为了让不同 anchor 的 pos 权重的方差更大，增加指数调节因子：

最终，各 anchor 的 pos 权重会依据对应 GT 的候选 anchor 的 pos 权重之和进行归一化。

pos 权重尽管能够使得统一的 anchor 同时具备高 cls 分数和高 IoU，但无奈辨别不统一 anchor 的重要水平。如后面图 1 所示，anchor D 定位校准但分类分数较低，而 anchor B 恰好相反。两者的一致性水平 $t$ 统一，pos 权重无奈辨别差别。为了给检测器提供更多的监督信息，精确地体现 anchor 的重要水平，论文提出为两者赋予更清晰的 neg 权重，具体由以下两局部形成。

Probability of being a Negative Sample
依据 COCO 的验证指标，IoU 不满足阈值的预测后果一律归为谬误的检测。所以，IoU 是决定 achor 为负样本的概率的惟一因素，记为 $P_{neg}$。因为 COCO 应用 0.5-0.95 的 IoU 阈值来计算 AO，所以 $P_{neg}$ 应该满足以下规定：

任意 $[0.5,0.95]$ 上枯燥递加的函数都能够作为 $P_{neg}$ 两头局部。为了简便，论文采纳了以下函数：

公式 6 须要穿过点 $(0.5,1)$ 和 $(0.95, 0)$，一旦 $\gamma_1$ 确定了，参数 $k$ 和 $b$ 可通过待定系数法确定。

图 3 展现了不同 $\gamma_1$ 下的 $P_{neg}$ 曲线。

Importance Conditioned on being a Negative Sample
在推理时，ranking 队列中靠前的 neg 预测后果尽管不会影响召回率，但会升高准确率。为了失去更高的性能，应该尽可能地升高 neg 预测后果的 ranking 分数。所以在训练中，ranking 分数较高的 neg 预测后果应该比 ranking 分数较低的预测后果更为重要。基于此，定义 neg 预测后果的重要水平 $I_{neg}$ 为 ranking 分数的函数：

最终，整体的 neg 权重 $w_{neg}=P_{neg}\times I_{neg}$ 变为：

$w_{neg}$ 与 $IoU$ 负相关，与 $s$ 正相干。对于 pos 权重雷同的 anchor，IoU 更小的会有更大的 neg 权重。在兼容验证指标的同时，$w_{neg}$ 能给予检测器更多的监督信息。

pos 权重和 neg 权重都以 IoU 作为输出，更精确的 IoU 能够保障更高质量的训练样本，有助于学习更强的特色。为此，论文提出了新的 box 精调操作，基于预测的四条边的偏移值 $O\in R^{H\times W\times 4}$ 进行下一步的精调。

思考到指标边界上的点有更大的概率预测精确的地位，论文设计了可学习的预测模块，基于初步的 bbox 为每条边生成边界点。如图 4 所示，四个边界点的坐标定义为：

其中，$\{\Delta^x_l,\Delta^y_l,\Delta^x_t,\Delta^y_t,\Delta^x_r,\Delta^y_r,\Delta^x_b,\Delta^y_b\}$ 为精调模块的输入。最初，联合边界点的预测和精调模块的输入，最终精调后的 anchor 偏移 $O^{‘}$ 为：

DW 策略可间接利用到大多数的 dense 检测器中。论文将 DW 利用到 FCOS 中并进行了大量批改，将 centerness 分支和分类分支合并成 cls 分数，网络的损失为：

这里的 $\beta$ 跟公式 3 是同一个，$N$ 和 $M$ 别离为候选 anchor 数和非候选 anchor 数。

均衡超参数对性能的影响。

候选 anchor 抉择办法对性能的影响。第一种为中心点的间隔阈值，第二种抉择最近的几个，第三种为间隔权重与 pos 权重乘积排序。

neg 权重计算形式比照。

LA 钻研之间的比照。

与 SOTA 检测算法比照。

论文提出自适应的 label assignment 办法 DW，突破了以往耦合加权的常规。依据不同角度的一致性和非一致性指标，动静地为 anchor 调配独立的 pos 权重和 neg 权重，能够更全面地监督训练。此外，论文还提出了新的预测框精调操作，在回归特色图上间接精调预测框。

如果本文对你有帮忙，麻烦点个赞或在看呗～
更多内容请关注微信公众号【晓飞的算法工程笔记】

正文完

机器学习

发表至：机器学习

2022-07-12

0

关于机器学习:科罗拉多州立大学发布CSUMLP模型用随机森林预测中期恶劣天气

关于机器学习:机器学习8吴恩达笔记

关于机器学习:MindSporeYOLOv3人体目标检测模型实现三

关于机器学习:机器学习吴恩达小白笔记2

关于容器技术:玩火的容器内存控制-CGroup-容器基础拾遗-Part-1

关于机器学习:DW优化目标检测训练过程更全面的正负权重计算-CVPR-2022

Introduction

Proposed Method

Motivation and Framework

Positive Weighting Function

Negative Weighting Function

Probability of being a Negative Sample

Importance Conditioned on being a Negative Sample

Box Refinement

Loss Function

Experiment

Conclusion

Just My Socks（注册教程内含优惠码）

关于机器学习:DW优化目标检测训练过程更全面的正负权重计算-CVPR-2022

Introduction

Proposed Method

Motivation and Framework

Positive Weighting Function

Negative Weighting Function

Probability of being a Negative Sample

Importance Conditioned on being a Negative Sample

Box Refinement

Loss Function

Experiment

Conclusion

Just My Socks（注册教程 内含优惠码）

Just My Socks（注册教程内含优惠码）