乐趣区

关于人工智能:推荐几篇近期必看的视觉综述含GANTransformer人脸超分辨遥感等

编译 | CV 君
报道 | 我爱计算机视觉(微信 id:aicvml)

本文介绍 2021 年这半月以来的 CV 畛域相干综述。文末附打包下载。

GAN 综述

GAN 逆映射问题:全面调研(GAN Inversion: A Survey

GAN 逆映射指将给定图像转化到预训练 GAN 模型的隐空间,生成器可用其逆映射码进行牢靠的图像重建。

GAN 逆映射成为连贯实在图像和假图像的公共空间,在诸如 StyleGAN 和 BigGAN 等 GAN 模型进行图像编辑工作中起到十分重要的作用。其暗藏了咱们了解 GAN 隐空间和如何生成具备真实感图像的明码。因而,钻研 GAN 逆映射问题是十分重要的。

这篇综述论文聚焦于此问题,参考了 240 篇 文献,对近年来的算法和利用进行了全面综述(重要技术及其在图像复原与编辑中的利用),同时指出了将来的发展趋势和挑战。

除论文外,作者还建设了相应 Github 仓库,以便进一步跟踪该畛域的倒退:

https://github.com/weihaox/aw…

作者 | Weihao Xia, Yulun Zhang, Yujiu Yang*, Jing-Hao Xue, Bolei Zhou*, Ming-Hsuan Yang*

单位 | 清华大学、美国东北大学、伦敦大学学院、香港中文大学、加利福尼亚大学默塞德分校

地址 | https://arxiv.org/abs/2101.05278

Transformer 综述

近期实火的 Transformers,“走遍”CV 畛域的各个方向,前期,CV 君将会对 Transformers 在 CV 畛域的利用做一次总结,供大家参考。

以下先来一个开胃菜『Transformers in Vision: A Survey』,本篇综述旨在为计算机视觉学科中的 Transformers 模型提供一个全面的概述,其中涵盖了 Transformers 在计算机视觉畛域中广泛应用,包含风行的辨认工作(如图像分类、指标检测、动作辨认和宰割);Generative Models(生成模型);多模态工作(如视觉问题答复和视觉推理);视频解决(如流动辨认、视频预测);low-level vision(如图像超分辨率和着色);3D 剖析(如点云分类和宰割)。并从架构设计和试验价值两个方面比拟了风行技术各自的劣势和局限性。

最初,作者对凋谢的钻研方向和将来可能的工作进行了剖析。

作者 | Salman Khan, Muzammal Naseer, Munawar Hayat, Syed Waqas Zamir, Fahad Shahbaz Khan, Mubarak Shah

单位 | MBZUAI;蒙纳士大学等

论文 | https://arxiv.org/abs/2101.01169

人脸超分辨率综述

Deep Learning-based Face Super-resolution: A Survey

人脸超分辨率也称为人脸幻构,目标是进步一张或一序列低分辨率 (LR) 人脸图像的分辨率,生成相应的高分辨率 (HR) 人脸图像,是一个特定畛域的图像超分辨率问题。最近,人脸超分辨率受到了相当大的关注,并见证了深度学习技术的夺目停顿。但到目前为止,对于基于深度学习的人脸超分辨率的钻研总结还很少。

在本次考察中,作者系统地对人脸超分辨率中的深度学习技术进行了全面的回顾。

首先,总结了人脸超分辨率的问题表述。

第二,比拟了通用图像超分辨率和人脸超分辨率的区别。

第三,介绍了人脸幻构中罕用的数据集和性能指标。

第四,依据人脸特定信息的利用状况,对现有办法进行粗略分类。在每一个类别中,首先对设计准则进行总体形容,对有代表性的办法进行概述,并比拟各种办法之间的异同。

最初,瞻望了该畛域技术进一步倒退的前景。

作者 | Junjun Jiang, Chenyang Wang, Xianming Liu, Jiayi Ma

单位 | 哈尔滨工业大学;武汉大学

论文 | https://arxiv.org/abs/2101.03749

单分类综述

One-Class Classification: A Survey

单类分类 (OCC) 是多类分类的一种非凡状况,在训练过程中来自 single positive class 察看到的数据。OCC 的指标是学习一个示意和 / 或一个分类器,使其在推理过程中可能辨认正向标签的查问。

近年来,这一主题在计算机视觉、机器学习和生物辨认学界受到了相当大的关注。在本次调研中,作者对经典的统计办法和近期基于深度学习的视觉辨认 OCC 办法进行了考察。探讨了现有 OCC 办法的长处和毛病,并确定了该畛域有前途的钻研方向。此外,还对 OCC 罕用的数据集和评估指标进行了探讨。

作者 | Pramuditha Perera, Poojan Oza, Vishal M. Patel

单位 | 约翰斯·霍普金斯大学

论文 | https://arxiv.org/abs/2101.03064

人员重辨认综述

『Deep Learning for Person Re-identification: A Survey and Outlook』

是 TPAMI 2021 最新文章,对深度学习行人重辨认的综述与瞻望,第一作者来自武汉大学的叶茫,上周在我爱计算机视觉公众号也公布了本篇文章的具体解读,感兴趣的读者能够查看【深度学习行人重辨认综述与瞻望,TPAMI 2021 最新文章】

行为辨认综述

Human Activity Recognition using Wearable Sensors: Review, Challenges, Evaluation Benchmark

本次考察中,作者对近期基于可穿戴传感器的人类流动辨认中的优异体现办法进行了宽泛回顾。

因为不足标准化的评估,为了评估和确保最先进的技术之间的偏心比拟,作者利用六个公开的数据集 MHealth, USCHAD, UTD-MHAD, WISDM, WHARF, and OPPORTUNITY,对最先进的技术进行了标准化的评估基准。

同时提出一种实验性的改良办法,先利用特色工程提取特色,而后采纳 3 层神经网络架构,以此混合试验进行人类流动辨认。在同样的标准化评估基准下,试验表明该混合试验具备较强的泛化能力和较高的辨认精度,在 MHealth、USCHAD、UTD-1 和 UTD-2 数据集上的体现优于所有的先进技术。

作者 | Reem Abdel-Salam, Rana Mostafa, Mayada Hadhood

单位 | 埃及开罗大学

论文 | https://arxiv.org/abs/2101.01665

遥感土地利用剖析综述

Urban land-use analysis using proximate sensing imagery: a survey 是对 proximate sensing 反对土地利用剖析的最先进办法和公开的数据集进行了全面回顾。

作者 | Zhinan Qiao, Xiaohui Yuan

论文 | https://arxiv.org/abs/2101.04827

深度神经网络综述

Hyperbolic Deep Neural Networks: A Survey

本文围绕双曲深层神经网络构建中的神经组件,以及当先的深层办法在双曲空间的泛化,对文献进行了连贯而全面的回顾。

还介绍了以后在几个公开可用的数据集上围绕各种机器学习工作的利用,以及有洞察力的见地和确定凋谢的问题和有前途的将来方向。

authors | Wei Peng, Tuomas Varanka, Abdelrahman Mostafa, Henglin Shi, Guoying Zhao

units | 芬兰奥卢大学

paper | https://arxiv.org/abs/2101.04562

注:以上综述论文文章可在『OpenCV 中文网』公众号后盾回复【综述】取得百度云下载地址。

– END –

编译:CV 君

转载请分割本公众号受权

退出移动版