关于人工智能:PIoU-Loss倾斜目标检测专用损失函数公开数据集Retail50K-ECCV-2020-Spotlight

38次阅读

共计 2279 个字符,预计需要花费 6 分钟才能阅读完成。

论文提出从 IoU 指标延长来的 PIoU 损失函数,可能无效地进步歪斜指标检测场景下的旋转角度预测和 IoU 成果,对 anchor-based 办法和 anchor-free 办法均实用。另外论文提供了 Retail50K 数据集,可能很好地用于评估歪斜指标检测算法的性能

起源:晓飞的算法工程笔记 公众号

论文: PIoU Loss: Towards Accurate Oriented Object Detection in Complex Environments

  • 论文地址:https://arxiv.org/abs/2007.09584
  • 论文代码:https://github.com/clobotics/piou

Introduction


  以后的指标检测办法因为 BB(bounding boxes) 的个性,对歪斜和密集物体的检测存在肯定的局限性。为了解决这个问题,研究者扩大出了带旋转参数的 OBB(oriented bounding boxes),即从 BB($c_x,c_y,w,h$) 扩大为 OBB($c_x,c_y,w,h,\theta$),其中 $\theta$ 旋转角度,这样 OBB 就能更紧凑地突围指标,能够更好地检测旋转和密集的物体。

  目前的 OBB-based 办法大多数在 anchor-based 架构上采纳间隔损失来优化上述的 5 个参数,并且在航空图片的指标检测上曾经有一些利用。但其检测性能在更简单的场景中仍然存在局限性,次要起因在于间隔损失更多地是优化旋转角度误差,而不是优化全局 IoU,特地是对长条形物体很不敏感。如图 a 所示,两个 IoU 相差很大的情景下,间隔损失的后果却是一样的。

  为了解决这个问题,论文提出 PIoU(Pixels-IOU) 损失来同时进步旋转角度和 IoU 的准确率。如图 b 所示,PIoU 损失能间接反映物体间的 IoU,但因为 OBB 间的相交区域可能是多边形,OBB 的 IoU 比 BB 的 IoU 要难算得多,所以 PIoU 损失以逐像素判断的形式进行 IoU 计算并且是间断可微的。另外论文还提供了蕴含高长宽比歪斜指标的检测数据集 Retail50K,不便 OBB-based 检测算法的钻研。
  论文的奉献如下:

  • 提出新的损失函数 PIoU 损失,可能晋升歪斜指标的检测成果。
  • 提供新的数据集 Retail50K,能够更好的进行 OBB-based 算法的评估。
  • 通过试验证实 PIoU 损失的有效性,可能使用于 anchor-based 和 anchor-free 办法。

Pixels-IoU (PIoU) Loss


  对于 OBB $b$($c_x, c_y, w,h,\theta$),现实的损失函数可能疏导网络最大化 IoU,升高 $b$ 的错误率。为了达到这个目标,须要精确且高效地计算 OBB 间的 IoU,论文采纳了像素计数的形式来计算 IoU。

  对于点 $p_{ij}$ 和 OBB $b$,依据其到中线的间隔 $d^h_{i,j}$ 和中线交点到中点的间隔 $d^w_{i,j}$ 来判断点是否在 OBB 内:

  定义 $B_{b,b^{‘}}$ 为突围 $b$ 和 $b^{‘}$ 的最小正方形,能够通过判断 $B_{b,b^{‘}}$ 中的所有像素来计算 $b$ 和 $b^{‘}$ 间的交加区域和并集区域:

  最初通过 $S_{b\cap b^{‘}}$ 除以 $S_{b\cup b^{‘}}$ 计算 IoU,但公式 1 并不是间断可微函数,导致不能进行反向流传训练。为了解决这个问题,将公式 1 转换为两个核的乘积 $F(p_{i,j}|b)$:

  其中 $k$ 用于管制对指标像素 $p_{i,j}$ 的敏感水平,因为公式 9 应用了绝对地位信息 (图 a 的点间隔和三角形的角度),所以 $S_{b\cap b^{‘}}$ 和 $S_{b\cup b^{‘}}$ 均是对 OBB 的旋转角度和大小敏感的。

  如图 b 所示,$F(p_{i,j}|b)$ 是间断可微的,且与公式 1 相似。当 $p_{i,j}$ 在 $b$ 内时,$F(p_{i,j}|b)$ 靠近于 1,反之则靠近于 0。为此,$b$ 和 $b^{‘}$ 的交并集区域计算变为:

  为了升高公式 11 的计算量,简化为:

  基于公式 10 和公式 12,PIoU 的计算为:

  定义 $M$ 为所有正样本对,PIoU 损失的计算为:

  PIoU 损失也可用于无交加的 OBB,因为 PIoU 始终大于零,梯度仍然能够计算,另外 PIoU 损失也能够用于失常的 BB 场景中。

Retail50K Dataset


  之前的大多数 OBB 数据集都是航空图片,少部分数据集对 MSCOCO 等数据集进行从新标注。据统计,航空图片数据集中大多数 OBB 的长宽比都在 1:4 内,而支流数据集则集中在 1:1,不可能很好地评估 OBB-based 办法的性能。为此,论文提供了 Retail50K 数据集,由 47000 张不同的超市图片形成,标注对象为货架的层架边。数据集蕴含简单的背景和高长宽比指标,并且具备理论应用意义。

Experiments


  不同 $k$ 下比照试验。

  比照其它损失函数在 OBB 场景下的性能。

  比照其它损失函数在 BB 场景下的性能。

  Retail50K 数据集上的性能比照。

  HRSC2016 数据上的性能比照。

  DOTA 数据上的性能比照。

  后果可视化比照。

Conclustion


  论文提出从 IoU 指标延长来的 PIoU 损失函数,可能无效地进步歪斜指标检测场景下的旋转角度预测和 IoU 成果,对 anchor-based 办法和 anchor-free 办法均实用。从后果来看,PIoU 损失的成果还是非常显著的。另外论文提供了 Retail50K 数据集,可能很好地用于评估歪斜指标检测算法的性能。



如果本文对你有帮忙,麻烦点个赞或在看呗~
更多内容请关注 微信公众号【晓飞的算法工程笔记】

正文完
 0