关于自动驾驶:DeepRoute-Lab-AAAI22参会见闻与论文杂谈

By 元戎感知组

明天次要和大家分享的是往年2月底加入的AAAI22的一些见闻以及一些感兴趣的论文杂谈。再次安利一下咱们组最新的一篇被AAAI22接管的点云全景宰割的oral paper Sparse Cross-scale Attention Network for Efficient LiDAR Panoptic Segmentation，没看过的小伙伴能够点击链接到之前的文章里查看哦。

AAAI22会议见闻

作为人工智能的顶会之一，2022年的AAAI又发明了该会议的历史投稿新高，一共收到了9251 篇投稿，其中 9020 篇投稿进入了评审环节，然而最初的承受率则是历届最低，只有15.0%，1349篇论文被承受，真是越来越“卷”了。
因为疫情的起因，这次大会以线上会议的模式在虚拟空间内举办，这也是最近一些AI会议的罕用操作了。图里就是这次AAAI的主会场了，入口外是一个虚构公园，进入后右边的红色修建、左边的蓝色修建都是这次的会场的入口电梯。每个会场中除了有赞助商的地位外，还各有6组海报进行轮流展现，以及2个会议室。

AAAI22的虚构公园

依据官网的日程表抉择你想要看的海报后，进入相应的修建，来到对应的海报展位，凑近后就会弹出选项，确认后就能够进入到全屏的poster页面，相似一个小型的会议，你能够和海报的主持人进行沟通发问，还是挺不便的。下图是小编在日常“接客”。如果是Oral的话就是在海报两侧的会议室，会有提前录好的视频进行播放，如果作者在还能够进行在线发问。

海报答疑

会议的状况就根本介绍到这里啦，上面会介绍下在会上到处“晃悠”看到的集体比拟感兴趣的工作，次要集中在主动驾驶3D感知相干的工作，大家有趣味能够一起来看下~

AAAI22 3D指标检测论文盘点

AAAI22接管了不少和3D相干的论文，这里小编依据个人兴趣着重介绍上面3篇，次要是和3D detection相干，可能晋升现有网络的性能或是解决一些辣手的感知问题。

AFDetV2: Rethinking the Necessity of the Second Stage for Object Detection from Point Clouds 【1】

AFDetV2 是Real-Time 3D Detection of the Waymo Open Dataset Challenge 2021的第一名。次要的改良点是从second stage失去的启发。
咱们为什么须要second stage, 一般来说有两种理由：

点云的特色能够复原因voxelization， striding operations或者lack of receptive field而损失的地位信息；
物体检测框的回归和物体的分类是两个独立的Head，因而分类置信度可能不能对齐回归的精度

作者通过试验，验证了只用一阶段的voxel-wise特色也能够失去足够准确的物体框回归，因而二阶段的次要奉献来源于分类score的晋升，使得分类和回归的精度对齐匹配。基于这个察看，作者提出了一个性能能够媲美二阶段网络的一阶段3D检测器，次要提出了：

把之前的卷积替换为self calibrated convolution block

减少一个IoU alignment head，并且和原始的分类score进行简略的交融

Keypoint auxiliary supervision：add another heatmap that predicts 4 corners and the center of every object in BEV during training

Behind the Curtain: Learning Occluded Shapes for 3D Object Detection 【2】

因为内部挡物(external occlusion)和自遮挡(self occlussion)，点云在不同物体能够采样失去齐全不同的点云状态，如下图所示：

这会带来两个问题：

遮挡使得物体的点云表现形式不同，有可能导致误检；
会导致shape missing，导致遮挡状态下预测的bbox的品质很低。

如果遮挡问题不存在会是怎么的呢？作者应用shape matching将类似车型的点云补到被遮挡的车上，发现在KITTI上性能能够迫近到100%，因而影响detection的一个次要起因是遮挡问题。

为了解决这个问题，作者提出了BtcDet来学习物体形态先验，并预计点云中局部遮挡的残缺物体形态。BtcDet首先辨认出受遮挡和信号缺失影响的区域。在这些区域中，模型预测了probability of occupancy，表明一个区域是否蕴含物体形态。联合这个概率图，BtcDet能够生成高质量的3D proposals。最初，将probability of occupancy集成到一个proposal refinement模块中，生成最终的物体检测框。

遮挡问题是线上一个比拟难解决的点，尤其是当远处大车被遮挡后会导致物体框的大小和地位跳变。作者提供了一个解决这个问题的计划，还是挺有启发的。

Joint 3D Object Detection and Tracking Using Spatio-Temporal Representation of Camera Image and LiDAR Point Clouds 【3】

这篇文章关注了感知畛域一个倒退的方向，即应用图像和lidar的fusion特色、应用时序特色，并且同时进行Detection和Tracking的工作。
本文提出的3D DetecTrack通过对相机和激光雷达交融失去的空间特色进行加权工夫聚合来结构时空特色。而后，检测器应用到上一个工夫步骤为止所保护的tracklet中的信息重新配置初始检测后果。Tracker基于Detector产生的时空特色，利用图神经网络(GNN)将被检测的指标与之前跟踪的指标关联起来。

最近CVPR的论文也有很多相似的工作，即Joint 3D Object Detection and Tracking，这也是一个新的值得摸索的方向

总结

加入会议最重要的是能够和泛滥研究者一起交换钻研方向，并且能够从论文的发表来捕获钻研方向演变的蛛丝马迹。除了下面的一些论文，还有其余很多值得一读的论文，比方SASA【4】，做的是point based 3D detection，这个方向最近的CVPR也有很多工作在做。再比方下面说的Occlusion和Joint 3D Object Detection and Tracking等方向，都是为了很好的联合产业方向的钻研畛域，期待有新的work呈现。文末附上了文中呈现的文章以及相干的一些AAAI22的文章，大家感兴趣能够去看下~

【1】Hu, Yihan; Ding, Zhuangzhuang; Ge, Runzhou; Shao, Wenxin; Huang, Li; Li, Kun; Liu, Qiang. “AFDetV2: Rethinking the Necessity of the Second Stage for Object Detection from Point Clouds.” AAAI. 2022.
【2】Xu, Qiangeng; Zhong, Yiqi; Neumann, Ulrich. “Behind the Curtain: Learning Occluded Shapes for 3D Object Detection.” AAAI. 2022.
【3】Koh, Junho; Kim, Jaekyum; Yoo, Jinhyuk; Kim, Yecheol; Kum, Dongsuk; Choi, Jun Won. “Joint 3D Object Detection and Tracking Using Spatio-Temporal Representation of Camera Image and LiDAR Point Clouds.” AAAI. 2022.
【4】Chen, Chen; Chen, Zhe; Zhang, Jing; Tao, Dacheng. “SASA: Semantics-Augmented Set Abstraction for Point-based 3D Object Detection.” AAAI. 2022.
【5】Liu, Xianpeng; Xue, Nan; Wu, Tianfu. “Learning Auxiliary Monocular Contexts Helps Monocular 3D Object Detection.” AAAI. 2022.
【6】He, Qingdong; Wang, Zhengning; Zeng, Hao; Zeng, Yi; Liu, Yijun. “SVGA-Net: Sparse Voxel-Graph Attention Network for 3D Object Detection from Point Clouds.” AAAI. 2022.
【7】Song, Nan; Jiang, Tianyuan; Yao, Jian. “JPV-Net: Joint Point-Voxel Representations for Accurate 3D Object Detection.” AAAI. 2022.
【8】Zhao, Na; Lee, Gim Hee. “Static-Dynamic Co-Teaching for Class-Incremental 3D Object Detection.” AAAI. 2022.

关于自动驾驶:DeepRoute-Lab-AAAI22参会见闻与论文杂谈

AAAI22会议见闻

AAAI22 3D指标检测论文盘点

AFDetV2: Rethinking the Necessity of the Second Stage for Object Detection from Point Clouds 【1】

Behind the Curtain: Learning Occluded Shapes for 3D Object Detection 【2】

Joint 3D Object Detection and Tracking Using Spatio-Temporal Representation of Camera Image and LiDAR Point Clouds 【3】

总结

评论

发表回复取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

关于自动驾驶:DeepRoute-Lab-AAAI22参会见闻与论文杂谈

AAAI22会议见闻

AAAI22 3D指标检测论文盘点

AFDetV2: Rethinking the Necessity of the Second Stage for Object Detection from Point Clouds 【1】

Behind the Curtain: Learning Occluded Shapes for 3D Object Detection 【2】

Joint 3D Object Detection and Tracking Using Spatio-Temporal Representation of Camera Image and LiDAR Point Clouds 【3】

总结

评论

发表回复 取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

发表回复取消回复