共计 4150 个字符,预计需要花费 11 分钟才能阅读完成。
编译 | CV 君
报道 | OpenCV 中文网(微信 id:iopencv)
本篇文章盘点 WACV2021 图像宰割相干论文,包含抠图、实例、全景、语义宰割,自然灾害评估等相干利用。值得关注的是有一篇文本抠图,在以往工作中很少或从未钻研过的。
共计 11 篇。如有脱漏,欢送补充。
下载蕴含这些论文的 WACV 2021 所有论文:
『WACV 2021 揭幕,更并重技术利用,附论文下载』
实例宰割
[1].Weakly Supervised Instance Segmentation by Deep Community Learning
文中作者引入一个用于弱监督实例宰割的深度社区学习框架,该框架基于一个端到端可训练的深度神经网络,在指标检测、实例掩码生成和指标宰割多个工作之间有被动交互。退出两种有教训的指标定位技术:class-agnostic bounding box regression 和 segmentation proposal generation,且是在没有齐全监督的状况下进行的。
所提出的算法在不进行后处理状况下,在规范基准数据集上实现了比现有弱监督办法大幅提高的性能。
作者 | Jaedong Hwang, Seohyun Kim, Jeany Son, Bohyung Han
单位 | 首尔大学;ETRI
论文 | https://arxiv.org/abs/2001.11207
主页 | https://cv.snu.ac.kr/research…
[2].MSNet: A Multilevel Instance Segmentation Network for Natural Disaster Damage Assessment in Aerial Videos
MSNet:用于航空视频自然灾害评估的多级实例宰割网络
本文钻研通过航空视频剖析,无效评估飓风、洪水或火灾等自然灾害后的建筑物损失问题。
做出了两个次要奉献:
第一个奉献是一个新的数据集,包含来自社交媒体用户生成的航拍视频,并带有实例级的修建伤害掩码标注。为利用航拍视频评估建筑物伤害的模型的定量评估提供了第一个基准。
第二个奉献是一个新的模型:MSNet,蕴含了新的区域 proposal 网络设计和一个无监督的分数细化网络,用于边界盒和掩模分支的置信度分数校准。
试验表明,新的模型和新的数据集与以前的办法相比,获得了最先进的后果。
作者示意将公布数据、模型和代码。
作者 | Xiaoyu Zhu, Junwei Liang, Alexander Hauptmann
单位 | 卡内基梅隆大学
论文 | https://w.url.cn/s/AC2eIwl
代码 | https://github.com/zgzxy001/M…
语义宰割
[3].Unsupervised Domain Adaptation in Semantic Segmentation via Orthogonal and Clustered Embeddings
作者 | Marco Toldo, Umberto Michieli, Pietro Zanuttigh
单位 | 意大利帕多瓦大学
论文 | https://arxiv.org/abs/2011.12616
主页 | https://lttm.dei.unipd.it/pap…
代码 | https://github.com/LTTM/UDAcl…
[4].Improving Point Cloud Semantic Segmentation by Learning 3D Object Detection
提出 Detection Aware 3D Semantic Segmentation (DASS) 网络来解决以后架构的局限性。
DASS 能够在放弃高精度鸟瞰(BEV)检测后果的同时,将几何类似类的 3D 语义宰割后果进步到图像 FOV 的 37.8% IoU。
作者 | Ozan Unal, Luc Van Gool, Dengxin Dai
单位 | 苏黎世联邦理工学院;鲁汶大学
论文 | https://arxiv.org/abs/2009.10569
[5].Multi Projection Fusion for Real-Time Semantic Segmentation of 3D LiDAR Point Clouds
本次工作,作者提出全新的 multi-projection 交融框架,通过应用球面和鸟瞰投影,利用 soft voting 机制对后果进行交融,实现点云语义宰割。所提出的框架在 SemanticKITTI 数据集上的 mIoU 达到了 55.5,高于最先进的基于 single projection 的办法 RangeNet++ 和 PolarNet,比前者快 1.6 倍,比后者快 3.1 倍。同时具备更高的 throughput(吞吐量)。
对于将来工作方向,作者称将两种 projections 联合成繁多的多视图对立模型,并钻研在框架内应用两种以上的 projections。
作者 | Yara Ali Alnaggar, Mohamed Afifi, Karim Amer, Mohamed Elhelw
单位 | Nile University;
论文 | https://arxiv.org/abs/2011.01974
[6].Shape From Semantic Segmentation via the Geometric Renyi Divergence
作者 | Tatsuro Koizumi, William A. P. Smith
单位 | 约克大学
论文 |
https://openaccess.thecvf.com…
全景宰割
[7].Boosting Monocular Depth With Panoptic Segmentation Maps
作者 | Faraz Saeedan, Stefan Roth
单位 | 达姆施塔特工业大学
论文 | https://openaccess.thecvf.com…
视频指标宰割
[8].Reducing the Annotation Effort for Video Object Segmentation Datasets
为进一步改良视频指标宰割的性能,须要更大、更多样化、更具挑战性的数据集。然而用像素掩码对每一帧进行密集标注并不能扩大到大型数据集。
因而作者应用深度卷积网络,从较便宜的边界框标注中主动创立像素级的伪标签,并钻研这种伪标签能在多大程度上承载训练最先进的 VOS 办法。令人欣慰的是,仅在每个对象的单个视频帧中增加一个手动标注的掩码,足以生成伪标签,用来训练 VOS 办法,并达到与齐全宰割视频训练时简直雷同的性能程度。
基于此,为 TAO 数据集的训练集创立像素伪标签,手动标注验证集的一个子集。失去了新的 TAO-VOS 基准,颁布在 https://www.vision.rwth-aache…(近期公开)
作者 | Paul Voigtlaender, Lishu Luo, Chun Yuan, Yong Jiang, Bastian Leibe
单位 | 亚琛工业大学;清华大学
论文 | https://arxiv.org/abs/2011.01142
代码 | https://www.vision.rwth-aache…
备注 | WACV 2021
指标局部宰割
[9].Part Segmentation of Unseen Objects using Keypoint Guidance
作者开发了一种端到端学习办法, 利用关键点地位疏导迁徙学习过程,将 pixel-level 指标局部宰割从齐全标记的指标集迁徙到另一个弱标记的指标集。对于局部宰割来说,作者证实非参数化的模板匹配办法比像素分类更无效,特地是对于小的或不太频繁的局部。
为验证所提出办法的通用性,作者引入了两个新的数据集,共蕴含 200 只四足动物,同时具备关键点和局部宰割标注。并证实所提出办法在训练过程中应用无限的局部宰割标签,能够在新型物体局部宰割工作上以较大的劣势优于现有模型。
作者 | Shujon Naha, Qingyang Xiao, Prianka Banik, Md. Alimoor Reza, David J. Crandall
单位 | 印第安那大学艺术迷信学院
论文 | https://openaccess.thecvf.com…
数据集 | http://vision.sice.indiana.ed…
图像抠图
Towards Enhancing Fine-Grained Details for Image Matting
提出一个对于图像抠图问题的新观点,明确地将这个工作分为两个局部:一个是提取高级语义线索的语义局部,另一个是提供精密细节和低级纹理线索的纹理弥补局部。
基于这一点,提出一种新的深度图像抠图办法,明确定义了两条门路:编码器 - 解码器语义门路和无下采样纹理弥补门路。进一步提出了一个新的损失项,帮忙网络缓解不精确的 trimap 问题,更好地检测那些 “ 纯 “ 背景局部。
所提出的办法在具备挑战性的 Adobe Composition1k 测试数据集上实现了新的最先进的性能。
作者 | Chang Liu, Henghui Ding, Xudong Jiang
单位 | 南洋理工大学
论文 | https://openaccess.thecvf.com…
Text Matting
ATM: Attentional Text Matting
本次钻研,作者尝试解决从图像背景中提取字符 (通常为 WordArts) 的 Text Matting(文本抠图)问题。与传统的图像抠图问题不同,文本抠图的难度要大得多,因为它的前景有三个个性:小、多指标、构造和边界简单。
计划是提出一个两阶注意力文本抠图 pipeline,作者称是首个文本抠图办法。构建了一个文本抠图图像合成引擎,并合成了一个具备多样性大规模的高质量文本抠图数据集。
在合成和实在图像数据集上进行了大量试验,证实所提出办法比最先进的图像抠图办法在文本抠图工作上的优越性。
作者 | Peng Kang, Jianping Zhang, Chen Ma, Guiling Sun
单位 | 美国西北大学;加拿大麦吉尔大学;南开大学
论文 |
https://openaccess.thecvf.com…
代码 | https://github.com/TextMattin…
【举荐浏览】
WACV 2021 论文大盘点 - 指标检测篇
WACV 2021 论文大盘点 - 人脸技术篇
– END –