关于算法:FSAF嵌入anchorfree分支来指导acnhorbased算法训练-CVPR2019

42次阅读

共计 2254 个字符，预计需要花费 6 分钟才能阅读完成。

FSAF 深刻地剖析 FPN 层在训练时的抉择问题，以超简略的 anchor-free 分支模式嵌入原网络，简直对速度没有影响，可更精确的抉择最优的 FPN 层，带来不错的精度晋升

起源：晓飞的算法工程笔记公众号

论文: Feature Selective Anchor-Free Module for Single-Shot Object Detection

论文地址：https://arxiv.org/abs/1903.00621
论文代码：https://github.com/zccstig/mmdetection/tree/fsaf

指标检测的首要问题就是尺寸变动，许多算法应用 FPN 以及 anchor box 来解决此问题。在正样本判断下面，个别先依据指标的尺寸决定预测用的 FPN 层，越大的指标则应用更高的 FPN 层，而后依据指标与 anchor box 的 IoU 进一步判断，但这样的设计会带来两个限度：拍脑袋式的特征选择以及基于 IoU 的 anchor 采样。

如图 2 所示，60×60 抉择两头的 anchor，而 50×50 以及 40×40 的则抉择最小的 anchor，anchor 的抉择都是人们依据教训制订的规定，这在某些场景下可能不是最优的抉择。

为了解决上述的问题，论文提出了简略且高效的特征选择办法 FSAF(feature selective anchor-free)，可能在每轮训练中抉择最优的层进行优化。如图 3 所示，FSAF 为 FPN 每层增加 anchor-free 分支，蕴含分类与回归，在训练时，依据 anchor-free 分支的预测后果抉择最合适的 FPN 层用于训练，最终的网络输入可同时综合 FSAF 的 anchor-free 分支后果以及原网络的预测后果。

FSAF 的网络后果非常简单，如图 4 所示。在原有的网络结构上，FSAF 为 FPN 每层引入两个额定的卷积层，别离用于预测 anchor-free 的分类以及回归后果。这样，在共用特色的状况下，anchor-free 和 anchor-based 的办法可进行联结预测。

对于指标 $b=[x,y,w,h]$，在训练时可映射到任意的 FPN 层 $P_l$，映射区域为 $b^l_p=[x^l_p, y^l_p, w^l_p, h^l_p]$。一般而言，$b^l_p=b/2^l$。定义无效边界 $b^l_e=[x^l_e, y^l_e, w^l_e, h^l_e]$ 和疏忽边界 $b^l_i=[x^l_i, y^l_i, w^l_i, h^l_i]$，可用于定义特色图中的正样本区域、疏忽区域以及负样本区域。无效边界和疏忽边界均与映射后果成等比关系，比例别离为 $\epsilon_e=0.2$ 和 $\epsilon_i=0.5$，最终的分类损失为所有正负样本的损失值之和除以正样本点数。

分类后果蕴含 $K$ 维，指标次要设定对应维度，样本定义分以下 3 种状况：

无效边界内的区域为正样本点。
疏忽边界到无效边界的区域不参加训练。
疏忽边界映射到相邻的特色金字塔层中，映射的边界内的区域不参加训练
其余区域为负样本点。

分类的训练采纳 focal loss，$\alpha=0.25$，$\gamma=2.0$，残缺的分类损失取所有正负区域的损失值之和除以无效区域点数。

回归后果输入为分类无关的 4 个偏移值维度，仅回归无效区域内的点。对于无效区域地位 $(i,j)$，将映射指标示意为 $d^l_{i,j}=[d^l_{t_{i,j}}, d^l_{l_{i,j}}, d^l_{b_{i,j}}, d^l_{r_{i,j}}]$，别离为以后地位到 $b^l_p$ 的边界的间隔，对应的该地位上的 4 维向量为 $d^l_{i,j}/S$，$S=4.0$ 为归一化常量。回归的训练采纳 IoU 损失，残缺的 anchor-free 分支的损失取所有无效区域的损失值的均值。

anchor-free 的设计容许咱们应用任意的 FPN 层 $P_l$ 进行训练，为了找到最优的 FPN 层，FSAF 模块须要计算 FPN 每层对指标的预测成果。对于分类与回归，别离计算各层无效区域的 focal loss 损失以及 IoU loss 损失：

在失去各层的后果后，取损失值最小的层作为当轮训练的 FPN 层：

因为 FSAF 对原网络的改变很少，在推理时，略微过滤下 anchor-free 和 anchor-based 分支的后果，而后合并进行 NMS。

残缺的损失函数综合 anchor-based 分支以及 anchor-free 分支，$L=L^{ab}+\lambda(L^{af_{cls}}+L^{af_{reg}})$

各种构造以及 FPN 层抉择办法的比照试验。

精度与推理速度比照。

与 SOTA 办法比照。

FSAF 深刻地剖析 FPN 层在训练时的抉择问题，以超简略的 anchor-free 分支模式嵌入原网络，简直对速度没有影响，可更精确的抉择最优的 FPN 层，带来不错的精度晋升。须要留神的是，尽管摈弃以往硬性的抉择办法，但实际上仍然存在一些人为的设定，比方无效区域的定义，所以该办法还不是最完满的。

如果本文对你有帮忙，麻烦点个赞或在看呗～
更多内容请关注微信公众号【晓飞的算法工程笔记】

正文完

算法

发表至：算法

2022-03-01

0

关于-0-到-n-中包含-1-的个数问题

关于算法:直播倒计时1天天翼云HPC解决方案助力企业腾飞

关于算法:159201算法探讨

关于算法:Chai-3D-组件工具

关于python:Python-中-base64-编码与解码

关于算法:FSAF嵌入anchorfree分支来指导acnhorbased算法训练-CVPR2019

Introduction

Network Architecture

Ground-truth and Loss

Classification Output

Box Regression Output

Online Feature Selection

Joint Inference and Training

Inference

Optimization

Experiments

Conclusion

Just My Socks（注册教程内含优惠码）

关于算法:FSAF嵌入anchorfree分支来指导acnhorbased算法训练-CVPR2019

Introduction

Network Architecture

Ground-truth and Loss

Classification Output

Box Regression Output

Online Feature Selection

Joint Inference and Training

Inference

Optimization

Experiments

Conclusion

Just My Socks（注册教程 内含优惠码）

Just My Socks（注册教程内含优惠码）