标签: 计算机视觉
-
关于计算机视觉:探究计算机视觉新兴能力如何通过提示检索提高性能
因为其弱小的泛化性能,在宽泛数据上训练的大规模模型最近已成为计算机视觉中的支流架构。次要摸索了大规模视觉模型中…
-
关于计算机视觉:根据文本描述生成视频TuneAVideo-效果惊艳
以文本-图片生成模型的胜利为灵感,近来文本-视频生成模型也开始采纳大规模的文本-视频数据集进行微调训练。然而解…
-
关于计算机视觉:AAAI-2023针对视频分类的知识迁移
从与工作无关的预训练深度模型中为上游工作转移常识是计算机视觉钻研中的一个重要课题。 随着计算能力的增长,当初曾…
-
关于计算机视觉:ECCV-2022TeSTRa稳定的流式视频识别
流式视频辨认视频会关注每一个视频帧中的对象及其行为。一个好的流式辨认模型能够捕捉视频的长期动静和短期变动。然而…
-
关于计算机视觉:SVFormer走进半监督动作识别的视觉-Transformer
半监督学习(SSL)的动作辨认是一个要害的视频了解工作,然而视频标注的高老本加大了该工作的难度。目前相干的办法…
-
关于计算机视觉:新型掩码自编码器-AdaMAE自适应采样
Masked Autoencoders (MAEs) 通过从可见数据的 token 重建带掩码的输出数据,学习…
-
关于计算机视觉:BATMAN将双边注意力用于视频对象分割
视频对象宰割 (Video Object Segmentation,VOS) 是视频了解的根底。 基于 Tra…
-
关于计算机视觉:SparK-用稀疏掩码为卷积设计-Bert-预训练
稠密掩码建模 (SparK) 是第一个 BERT-style 的预训练方法,无需批改骨干即可间接在任何卷积网络…
-
关于计算机视觉:MixMIM-创建混合图像提出新型掩码方案
商汤和港中文联结提出一种简略但无效的掩码图像建模(MIM)办法 MixMIM,通过创立混合图像利用BEiT和M…
-
关于计算机视觉:视觉模型-ConvNeXt-V2结合纯卷积与MAE
近年来以 ConvNeXt 为代表的古代 ConvNets 在各种视觉场景中都体现出了弱小的性能。尽管这些模型…