大盘点CVPR-2020目标检测论文精选

56次阅读

共计 2437 个字符，预计需要花费 7 分钟才能阅读完成。

本文为学习笔记
参加：王博 kings，Sophia

最近完结的 CVPR 2020 在推动物体检测方面做出了巨大贡献。在本文中，咱们将介绍一些特地令人印象粗浅的论文。

HGNet 蕴含三个次要组件：

基于 GConv 的 U 形网络（GU-net）
提案生成者
提案推理模块（ProRe Module）- 应用齐全连贯的图对提案进行推理

作者提出了一种重视形态的 GConv（SA-GConv），以捕捉部分形态特色。这是通过对绝对几何地位进行建模以形容对象形态来实现的。

基于 SA-GConv 的 U 型网络可捕捉多级性能。而后将它们通过投票模块映射到雷同的特色空间，并用于生成倡议。下一步，基于 GConv 的提案推理模块应用提案来预测边界框。

以下是在 SUN RGB-D V1 数据集上取得的一些性能后果。

在本文中，作者提出了混合体素网络（HVNet），这是一个用于基于点云的 3D 对象检测主动驾驶的一级网络。

本文中应用的体素特色编码（VFE）办法蕴含三个步骤：

体素化—将点云调配给 2D 体素网格
体素特征提取 - 计算与网格相干的逐点特色，该点特色被馈送到 PointNet 款式特色编码器
投影 - 将逐点特色聚合到体素级特色并将其投影到其原始网格。这造成伪图像特色图

体素的大小在 VFE 办法中十分重要。较小的体素尺寸能够捕捉更精密的几何特色。它们也更善于对象本地化，但推理工夫更长。应用较粗的体素能够取得更快的推理速度，因为这会导致较小的特色图。然而，它的性能较差。

作者提出了混合体素网络（HVNet），以实现细粒度体素性能的利用。它由三个步骤组成：

多尺度体素化 - 创立一组特色体素尺度并将它们调配给多个体素。
混合体素特征提取 - 计算每个比例的体素相干特色，并将其输出到关注特色编码器（AVFE）中。每个体素比例尺上的因素都是逐点连贯的。
动静因素投影 - 通过创立一组多比例我的项目体素将因素投影回伪图像。

这是在 KITTI 数据集上取得的后果。

本文的作者提出了一种图神经网络 -Point-GNN- 从 LiDAR 点云中检测物体。网络预测图形中每个顶点所属的对象的类别和形态。Point-GNN 具备主动回归机制，能够一次检测多个物体。

所提出的办法包含三个局部：

图形构建：体素降采样点云用于图形构建
T 迭代的图神经网络
边界框合并和评分

以下是在 KITTI 数据集上取得的后果：

代码：https://github.com/WeijingShi/Point-GNN

本文解决了检测嵌入在其周围环境中的物体的挑战 - 假装物体检测（COD）。作者还介绍了一个名为 COD10K 的新数据集。它蕴含 10,000 张图像，笼罩许多天然场景中的假装物体。它具备 78 个对象类别。图像带有类别标签，边界框，实例级别和消光级别的标签正文。

作者开发了一种称为搜寻标识网络（SINet）的 COD 框架。该代码在这里可用：

https://github.com/DengPingFan/SINet/

网络有两个次要模块：

搜寻模块（SM），用于搜寻假装的物体
用于检测物体的辨认模块（IM）

以下是在各种数据集上取得的后果：

本文提出了一个短时指标检测网络，该网络的指标是检测不可见类别的指标，并带有一些正文示例。

他们的办法包含留神 RPN，多重关系检测器和比照训练策略。该办法利用少拍反对集和查问集之间的相似性来标识新对象，同时还缩小了谬误标识。作者还奉献了一个新的数据集，其中蕴含 1000 个类别，这些类别的对象具备高质量的正文。https://github.com/fanq15/Few-Shot-Object-Detection-Dataset

该网络体系结构由一个权重共享框架组成，该框架具备多个分支 - 一个分支是查问集，其余分支用于反对集。权重共享框架的查问分支是 Faster R-CNN 网络。

作者介绍了带有多关系模块的注意力 RPN 和检测器，以在反对和查问中的潜在框之间产生精确的解析。

以下是在 ImageNet 数据集上取得的一些后果。

以下是在许多数据集上取得的一些察看后果。

本文的作者提出了 D2Det，一种解决精确定位和准确分类的办法。他们引入了密集部分回归，能够预测对象提案的多个密集框偏移。这使他们可能实现准确的定位。

作者还介绍了辨别 RoI 池计划，以实现精确的分类。合并计划从提案的几个子区域进行采样，并执行自适应加权以取得区别特色。

该代码位于：https://github.com/JialeCao001/D2Det

该办法基于规范的 Faster R-CNN 框架。在这种办法中，Faster R-CNN 的传统盒偏移回归被提议的密集部分回归所代替。在该办法中，通过判别式 RoI 池加强了分类。

在两阶段办法中，第一阶段应用区域提议网络（RPN），第二阶段应用独自的分类和回归分支。分类分支基于判断池。部分回归分支的指标是对象的精确定位。

以下是在 MS COCO 数据集上取得的后果：

链接：https://heartbeat.fritz.ai/cv…

计算机视觉联盟报道 | 公众号 CVLianMeng

正文完

深度学习

发表至：深度学习

2020-07-15

0

关于深度学习:三维设计新帮手｜Blender怎么入门

关于深度学习:MindSpore报Dead-code-exist-please-remove-it

关于深度学习:大型语言模型的推理演算

关于深度学习:MegEngine-Inference-卷积优化之-Im2col-和-winograd-优化

一安全公司利用客户漏洞非法获利-88-万公司法人自首被判-12-年

大盘点CVPR-2020目标检测论文精选

1、A Hierarchical Graph Network for 3D Object Detection on Point Clouds（用于点云 3D 指标检测的分层图网络）

2、HVNet: Hybrid Voxel Network for LiDAR Based 3D Object Detection（HVNet: 基于激光雷达的三维物体检测的混合体素网络）

3、Point-GNN: Graph Neural Network for 3D Object Detection in a Point Cloud（Point-GNN：用于点云中 3D 对象检测的图神经网络）

4、Camouflaged Object Detection

5、Few-Shot Object Detection with Attention-RPN and Multi-Relation Detector

6、D2Det: Towards High-Quality Object Detection and Instance Segmentation

Just My Socks（注册教程内含优惠码）

大盘点CVPR-2020目标检测论文精选

1、A Hierarchical Graph Network for 3D Object Detection on Point Clouds（用于点云 3D 指标检测的分层图网络）

2、HVNet: Hybrid Voxel Network for LiDAR Based 3D Object Detection（HVNet: 基于激光雷达的三维物体检测的混合体素网络）

3、Point-GNN: Graph Neural Network for 3D Object Detection in a Point Cloud（Point-GNN：用于点云中 3D 对象检测的图神经网络）

4、Camouflaged Object Detection

5、Few-Shot Object Detection with Attention-RPN and Multi-Relation Detector

6、D2Det: Towards High-Quality Object Detection and Instance Segmentation

Just My Socks（注册教程 内含优惠码）

Just My Socks（注册教程内含优惠码）