关于深度学习:EasyCV-DataHub-提供多领域视觉数据集下载助力模型生产

作者：伝迹谦言夕陌临在

在人工智能广泛应用的明天，深度学习技术曾经在各行各业起到了重要的作用。在计算机视觉畛域，深度学习技术在大多数场景曾经代替了传统视觉办法。如果说深度学习是一项重要的生产工具，那么数据就是不可或缺的生产资料，巧妇难为无米之炊，数据对于视觉模型生产起到了至关重要的作用。

EasyCV是阿里云机器学习平台团队开源的基于Pytorch的all-in-one视觉算法建模工具，搭建了丰盛欠缺的自监督算法体系，提供了成果SOTA的视觉Transformer预训练模型，modelzoo笼罩图像自监督训练、图像分类、度量学习、物体检测、实例宰割、语义宰割、关键点检测等畛域。

EasyCV提供了不同数据源(data_source)的形象，反对间接读取多种开源数据集格局例如Cifar、ImageNet、CoCo等，同时也反对PAI智能标注平台Itag标注格局和Tfrecord格局数据。 TFrecord格局数据反对应用DALI进行数据处理减速，Itag标注格局图片反对通过缓存机制减速数据读取。

为了不便EasyCV的用户进行模型指标复现、在理论场景训练应用模型，EasyCV汇总了不同畛域的罕用数据集的介绍和下载地址，以后涵盖图像分类、指标检测、图像宰割、姿势预计等方向，并针对较大且罕用的数据集例如imagenet在原许可证容许的状况下提供了国内网盘地址，不便用户疾速下载数据集进行论文指标对齐、模型成果比照、以及理论场景下的模型训练。

次要数据集介绍

上面按畛域介绍一下EasyCV以后整顿提供的数据集，其中加粗局部的数据集能够通过网盘链接下载。

datahub的应用细节可参考：https://github.com/alibaba/Ea…

图像分类

数据集汇总： ImageNet1K、ImageNet21K、Cifar10、Cifar100、MNIST、Fashion-MNIST、Flower102、Caltech101、Caltech256

ImageNet

官网链接：https://image-net.org/downloa…

网盘链接：

ImageNet1k https://pan.baidu.com/s/13pKw… 提取码：0zas

ImageNet1k TFrecord https://pan.baidu.com/s/153SY… 提取码：5zdc

ImageNet21k https://pan.baidu.com/s/1eJVP… 提取码:kaeg

ImageNet是市场上最大、最受欢迎的开源数据集之一。ImageNet领有超过1400万张已手动标注的图像。数据库按WordNet层次结构予以组织，对象级标注通过边界框实现。

指标检测

数据集汇总：COCO2017、VOC2007、VOC2012、LVIS、Cityscapes、Object365、CrowdHuman、OpenImages、WIDER FACE、DeepFashion、Fruit Images、Oxford-IIIT Pet、Arthropod Taxonomy Orders、African Wildlife、AI-TOD航空图、TinyPerson、WiderPerson、Caltech Pedestrian Dataset、DOTA

COCO2017

官网链接：https://cocodataset.org/#home

网盘链接：https://pan.baidu.com/s/14rO1… 提取码:bcmm

COCO 是一个大型图像数据集，其被用于机器视觉畛域的对象检测与宰割、人物关键点检测、填充宰割与字幕生成。该数据集以场景了解为主，图像中的指标则通过准确的宰割进行地位标定。

该数据集具备指标宰割、情景感知和超像素宰割三个特色，其蕴含 33 万张图像、150 万指标实例、80 个指标类、91 个物品类以及 25 万关键点人物。

LVIS

官网链接：https://www.lvisdataset.org/d…

网盘链接：https://pan.baidu.com/s/1Untu… 提取码:8ief

大规模的词汇实例宰割数据集(Large Vocabulary Instance Segmentation,LVIS )，蕴含了164k图像，并针对超过1000类物体进行了约200万个高质量的实例宰割标注。因为数据集中蕴含天然图像中的物体散布人造具备长尾属性。

Objects365

官网链接：https://www.objects365.org/ov…

该数据集总共蕴含63万张图像，笼罩365个类别，高达1000万框数，具备规模大、品质高、泛化能力强的特点，远超Pascal VOC、COCO等传统数据集。

宰割

数据集汇总：VOC2007、VOC2012、Pascal Context、COCO-Stuff 10K、Cityscapes、ADE20K

Cityscapes

官网链接：https://www.cityscapes-datase…

该数据集拍摄了国外多个城市街道场景图片，构建数据集，其分为三个局部，包含训练集，验证集和测试集，一共 19 个类别。

ADE20K

官网链接：http://groups.csail.mit.edu/v…

网盘链接：https://pan.baidu.com/s/1ZuAu… 提取码:dqim

ADE20K涵盖了场景、对象、对象局部的各种正文，在某些状况下甚至是局部的局部。有25k张简单日常场景的图像，其中蕴含天然空间环境中的各种对象。每个图像均匀有19.5个实例和10.5个对象类。

姿势预计

数据集汇总： COCO2017、MPII、CrowdPose、OCHuman

MPII

官网链接：http://human-pose.mpi-inf.mpg…

网盘链接：https://pan.baidu.com/s/1uscG… 提取码:w6af

MPII人体姿势数据集是评估关节人体姿势预计的最先进的基准。该数据集包含大概25K张图片，其中包含超过40K名带有标注身材关节的人。这些图像是依据人类日常流动的既定分类零碎收集的。总体而言，数据集涵盖410项人类流动，每张图像都有流动标签。每张图片都是从YouTube视频中提取的，并提供了前后未正文的帧。

EasyCV数据集接口应用示例

设计思路

EasyCV形象了data_source来封装不同格局的数据集，data_source输入图像相干的信息，而后通过指定dataset_type来创立不同工作类型的数据集对象进行训练。其中data_source类型包含ClsSourceImageList、DetSourceCoco、DetSourceVOC、PoseTopDownSourceCoco和SegSourceRaw等等，dataset_type类型包含RawDataset、ClsDataset、DetDataset和SegDataset等等。

以ImageNet数据集为例：

# 1. 配置imagenet数据集的config
dataset_type = 'ClsDataset'
data_train_list = 'data/imagenet_raw/meta/train_labeled.txt'
data_train_root = 'data/imagenet_raw/train/'
data_test_list = 'data/imagenet_raw/meta/val_labeled.txt'
data_test_root = 'data/imagenet_raw/val/'

dataset_type = 'ClsDataset'
data = dict(
    imgs_per_gpu=32,
    workers_per_gpu=4,
    train=dict(
        type=dataset_type,
        data_source=dict(
            list_file=data_train_list,
            root=data_train_root,
            type='ClsSourceImageList'),
        pipeline=train_pipeline),
    val=dict(
        type=dataset_type,
        data_source=dict(
            list_file=data_test_list,
            root=data_test_root,
            type='ClsSourceImageList'),
        pipeline=test_pipeline))

# 2. config实例化 
cfg = mmcv_config_fromfile(args.config)

# 3. 数据集实例化
distributed = torch.cuda.is_available(
) and torch.distributed.is_initialized()
default_args = dict(
    batch_size=cfg.data.imgs_per_gpu,
    workers_per_gpu=cfg.data.workers_per_gpu,
    distributed=distributed)
dataset = build_dataset(cfg.data.train, default_args)

其余和Imagenet格局类似的数据集，都能够通过替换data_train_list、data_train_root、data_test_list和data_test_root进行配置应用，具体的config配置形式可参考https://github.com/alibaba/Ea…。

我的项目开源地址：https://github.com/alibaba/Ea…

EasyCV往期分享

EasyCV带你复现更好更快的自监督算法-FastConvMAE
YOLOX-PAI:减速YOLOX,比YOLOV6更快更强
基于EasyCV复现DETR和DAB-DETR，Object Query的正确打开方式
基于EasyCV复现ViTDet：单层特色超过FPN
MAE自监督算法介绍和基于EasyCV的复现
EasyCV开源｜开箱即用的视觉自监督+Transformer算法库

关于深度学习:EasyCV-DataHub-提供多领域视觉数据集下载助力模型生产

次要数据集介绍

图像分类

ImageNet

指标检测

COCO2017

LVIS

Objects365

宰割

Cityscapes

ADE20K

姿势预计

MPII

EasyCV数据集接口应用示例

EasyCV往期分享

评论

发表回复取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

关于深度学习:EasyCV-DataHub-提供多领域视觉数据集下载助力模型生产

次要数据集介绍

图像分类

ImageNet

指标检测

COCO2017

LVIS

Objects365

宰割

Cityscapes

ADE20K

姿势预计

MPII

EasyCV数据集接口应用示例

EasyCV往期分享

评论

发表回复 取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

发表回复取消回复