关于人工智能:CVPR-2022上人脸识别相关的论文分类整理

40次阅读

共计 6182 个字符,预计需要花费 16 分钟才能阅读完成。

人脸识别是 AI 钻研的一个重要的方向,CVPR 2022 也有很多相干的论文,本篇文章将针对不同的利用分类进行整顿,心愿对你有帮忙

人脸识别

人脸识是一个热门话题,在以后的基准测试中要以相当大的晋升击败 现有的 SOTA 模型变得越来越艰难。

越来越多的凋谢数据能够用于训练,在百万级规模的数据上进行训练的一个次要问题是:最终的全连贯层随着身份的数量线性扩大,会导致每次迭代时内存占用微小并且反向流传时十分慢。一种旨在缓解这种状况的办法是 Partial FC [2](在往年 CVPR 上发表之前就曾经十分风行了)它曾经蕴含在 insightface 的 repo 中。该办法试图迫近当初规范的训练人脸识别办法 (如 CosFace、ArcFace 等) 的最初一层。为了达到更好的缩放人脸识别的目标,Wang 等人 (来自阿里巴巴) 的办法 [3] 应用名为动静分类池(Dynamic Class Pool)的来代替最初的 FC 层,并通过更好的数据加载器进行了进一步的改良(见下图)。

另外两篇对于人脸识别的论文:He at al. [4]试图将深度和反照率从人脸图像中分离出来, 进步应用 3D 信息的辨认能力。它通过引入带有两个辅助网络的 3D 人脸重建损失来实现这一点。当初又很多办法都在试图将面部整合成 3D 信息 (NeRF 的论文中也看到雷同的内容)。Phan 和 Nguyen 的[5] 办法也能够在重度遮挡人脸 (太阳镜、口罩等) 的人脸图片上验证,而且不须要对模型进行再训练。

[4] 应用人脸的 3D 重建来改善人脸识别。

[5] 提出了一种奇妙的办法来应用未被遮挡的面部局部进行面部验证(它不会从新训练模型)。

缩小偏置

往年在 CVPR 上看到了很多缩小偏置的办法,很多论文都提出了不须要大量的正文数据来显著加重偏置。

Liu 和 Yu[9]首先定义了一种新的人脸识别训练的边际损失,它应用了几种偏置因素的组合,如种族、姿态、含糊和遮挡。他们的办法也应用了一些长尾办法进行训练(学习如何学习)。

Jung, Chun 和 Moon[10]的“Learning Fair Classifiers with Partially Annotated Group Labels”提出,当只有一小部分数据集有敏感组标签的标注时,以后的偏心分类办法的性能比从头训练差。而后作者提出了一种办法:能够通过只对一小部分组数据进行标注来进步公平性——在他们的试验中,只有 10% 就足够了。。

Wang 等人 [11] 的钻研更进一步,提出了一种无需再训练就能加重已部署模型偏差的办法。它应用了那些在十年前风行的对抗性扰动,表明只须要增加一个看起来是随机的噪声(这在视觉上不会影响人类的图像),就能够在分类器中很容易扭转图像的一个类别。论文中他们试图找到这个扰动,来纠正仿佛来自模型偏差的误差。

活体检测

Dhar et al. [6] 提出了一种基于常识蒸馏的奇妙办法,将辨认和活体检测数据集联合在单个多任务网络中,用于人眼认证和演示攻打检测。当没有标注的活体检测数据集中的人的身份时这种办法是十分好的。

Wang et al. [7] 在人脸中获取随机补丁并利用相似于 arcface 的损失,来创立簇见间隔的图像特色,他们通过演示媒体和相机品质来辨别 PS 图像。

人脸伪造辨认

目前在认证零碎中经常出现的一种欺诈是人脸的伪造(deepfake),通过伪造人脸能够绕过检测零碎。

Shiohara 和 Yamasaki[12]提出了一种办法,通过应用同一个人作为源图像和指标图像(他们称之为自混合图像),使 deepfake 变得更加艰难。

Jia et al [13] 提出了一种创立对抗性攻打的办法,不仅在基于空间的检测器中无效,而且在基于频率的检测器中也无效。

人脸重建

人脸重建的目标是从低质量的人脸图像中重建出高质量的人脸图像。在

Zhu et al. [14](腾讯)利用 3D 信息来疏导形态并与生成先验整合来进行人脸重建。论文的结果表明,与 SOTA 相比,该办法在重建实在人脸方面体现得相当好,但从论文的图像样本中能够分明地看出,有时人的身份特色失落了——这意味着,重建的图像,即便是实在的人脸,它看起来也不是原始图像中的同一个人。

Zhao 等人发表了一篇十分乏味的论文,题为“Rethinking Deep Face Restoration”[15],正好论述了相似下面论文产生的身份失落的问题。他们将人脸修复问题分为人脸生成和人脸重建两个方面。通过独自解决每个问题,并在两个阶段提出改良,能够大大改善后果。他们还提出了一个新的衡量标准来评估在重建过程中保留了多少身份特色。这是第一篇以这种形式评估重建的论文。这样看,这个畛域将如何倒退,以及是否有可能在人脸识别之前应用这些办法还是能够有微小的提高的。

NeRF – 神经辐射场

NeRF 依然是本次 CVPR 中的热门话题,基本上 NeRF 是一个生成模型,它应用来自不同视点的对象图片进行训练。经过训练模型就可能生成场景的新视点。

往年 CVPR 最佳学生论文荣誉奖被授予 Verbin 等人的工作 [16]。他们的办法找到了一种改善 NeRF 镜面反射的办法(演示也很出彩)。只管没有用于面部生物辨认,但 NeRF 被大量用于参数化面部 / 头部。

Athar et al. [17]的工作联合了十分常见的人脸 3D 参数化 (3DMM) 和 NeRF。由此产生的零碎可能应用显式参数来扭转头部姿态和表情。也能够应用视频作为输出,并且他们也提供了视频的演示。

最初,Rebain 等人的一篇论文[18](谷歌)仿佛扭转了 nerf 的游戏规则,它被称为“LOLNeRF: Learn from One Look”。顾名思义,它们设法从大量单视图图像汇合中学习形态和外观示意,有趣味的能够看看他们提供的 DEMO。

总结

以上就是 CVPR 2022 上可能和人脸识别相干的论文总结,我在上面也提供了各个论文的援用,请按需查看:

1] — Kim, M., Jain, A. K., & Liu, X. (2022). AdaFace: Quality Adaptive Margin for Face Recognition. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 18750–18759).

[2] — An, X., Deng, J., Guo, J., Feng, Z., Zhu, X., Yang, J., & Liu, T. (2022). Killing Two Birds with One Stone: Efficient and Robust Training of Face Recognition CNNs by Partial FC. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 4042–4051).

[3] — Wang, K., Wang, S., Zhang, P., Zhou, Z., Zhu, Z., Wang, X., … & You, Y. (2022). An efficient training approach for very large scale face recognition. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 4083–4092).

[4] — He, M., Zhang, J., Shan, S., & Chen, X. (2022). Enhancing Face Recognition With Self-Supervised 3D Reconstruction. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 4062–4071).

[5] — Phan, H., & Nguyen, A. (2022). DeepFace-EMD: Re-Ranking Using Patch-Wise Earth Mover’s Distance Improves Out-of-Distribution Face Identification. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 20259–20269).

[6] — Dhar, P., Kumar, A., Kaplan, K., Gupta, K., Ranjan, R., & Chellappa, R. (2022). EyePAD++: A Distillation-based approach for joint Eye Authentication and Presentation Attack Detection using Periocular Images. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 20218–20227).

[7] — Wang, C. Y., Lu, Y. D., Yang, S. T., & Lai, S. H. (2022). PatchNet: A Simple Face Anti-Spoofing Framework via Fine-Grained Patch Recognition. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 20281–20290).

[8] — Wang, Z., Wang, Z., Yu, Z., Deng, W., Li, J., Gao, T., & Wang, Z. (2022). Domain Generalization via Shuffled Style Assembly for Face Anti-Spoofing. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 4123–4133).

[9] — Liu, C., Yu, X., Tsai, Y. H., Faraki, M., Moslemi, R., Chandraker, M., & Fu, Y. (2022). Learning to Learn across Diverse Data Biases in Deep Face Recognition. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 4072–4082).

[10] — Jung, S., Chun, S., & Moon, T. (2022). Learning Fair Classifiers with Partially Annotated Group Labels. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 10348–10357).

[11] — Wang, Z., Dong, X., Xue, H., Zhang, Z., Chiu, W., Wei, T., & Ren, K. (2022). Fairness-aware Adversarial Perturbation Towards Bias Mitigation for Deployed Deep Models. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 10379–10388).

[12] — Shiohara, K., & Yamasaki, T. (2022). Detecting Deepfakes with Self-Blended Images. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 18720–18729).

[13] — Jia, S., Ma, C., Yao, T., Yin, B., Ding, S., & Yang, X. (2022). Exploring Frequency Adversarial Attacks for Face Forgery Detection. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 4103–4112).

[14] — Zhu, F., Zhu, J., Chu, W., Zhang, X., Ji, X., Wang, C., & Tai, Y. (2022). Blind Face Restoration via Integrating Face Shape and Generative Priors. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 7662–7671).

[15] — Zhao, Yang, Yu-Chuan Su, Chun-Te Chu, Yandong Li, Marius Renn, Yukun Zhu, Changyou Chen, and Xuhui Jia.“Rethinking Deep Face Restoration.”In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, pp. 7652–7661. 2022.Neural Radiance Fields (NeRFs)

[16] — Verbin, D., Hedman, P., Mildenhall, B., Zickler, T., Barron, J. T., & Srinivasan, P. P. (2021). Ref-nerf: Structured view-dependent appearance for neural radiance fields. arXiv preprint arXiv:2112.03907.

[17] — Athar, S., Xu, Z., Sunkavalli, K., Shechtman, E., & Shu, Z. (2022). RigNeRF: Fully Controllable Neural 3D Portraits. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 20364–20373).

[18] — Rebain, D., Matthews, M., Yi, K. M., Lagun, D., & Tagliasacchi, A. (2022). LOLNeRF: Learn from One Look. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 1558–1567).

https://avoid.overfit.cn/post/9c15fe50f63e48739e2e8c1f40b5c76c

作者:Gustavo Führ

正文完
 0