关于自动驾驶:最全自动驾驶数据集分享系列二-语义分割数据集

34次阅读

共计 3875 个字符,预计需要花费 10 分钟才能阅读完成。


目前对于主动驾驶数据集你想晓得的,应该都在这里了,这是「整数智能」主动驾驶数据集八大系列分享之系列二:

「本期划重点」
波恩大学推出迄今为止最大的领有序列信息的数据集 SemanticKITTI

韩国科学技术院公布 Highway Driving,该数据集提供的标注在空间上和工夫上都比其余现有的数据集更密集

剑桥大学推出 CamVid,提供第一个具备对象类语义标签的视频汇合

「八大系列概览」
主动驾驶数据集分享是整数智能推出的一个全新分享系列,在这个系列中,咱们将介绍目前为止各大科研机构和企业推出的所有公开主动驾驶数据集。数据集次要分为八个系列:
系列一:指标检测数据集

系列二:语义宰割数据集

系列三:车道线检测数据集

系列四:光流数据集

系列五:Stereo Dataset

系列六:定位与地图数据集

系列七:驾驶行为数据集

系列八:仿真数据集

本文是 < 系列二语义宰割数据集 >,上面共包含 9 个数据集:

01
「SemanticKITTI」
公布方:波恩大学 (University of Bonn)
下载地址:
http://www.semantic-kitti.org…
论文地址:
https://www.researchgate.net/…
公布工夫:2019 年
简介:SemanticKITTI 是 KITTI 在语义宰割方向的子数据集,是激光雷达语义宰割的重要基准之一,是迄今为止最大的领有序列信息的数据集。它对 KITTI Vision Odometry Benchmark 中的所有序列都进行了标注,并为所用汽车激光雷达的残缺 360°视线提供了密集的逐点标注。基于该数据集,研发团队提出了三个基准工作:(i)应用单次扫描对点云进行语义宰割,(ii)应用序列计算多个过来扫描的语义分段,(iii)语义场景实现
特色

提供 23 201 次全 3D 扫描用于训练,20 351 次用于测试

该数据集蕴含 28 个标注类别,分为动态对象和动静对象,既包含行人、车辆等交通参与者,也包含停车场、人行道等高空设施

数据集包含 518 块瓷砖,共计超过 1700 个小时的标注工作

研发团队还将数据采集过程中用到的点云标记工具进行了开源

02
「Highway Driving」
公布方:韩国科学技术院(Korea Advanced Institute of Science and Technology)

下载地址:

https://sites.google.com/site…

论文地址

https://arxiv.org/pdf/2011.00…

公布工夫:2019 年

简介:高速公路驾驶数据集是一个密集标注的语义视频宰割工作的基准,它所提供的标注在空间上和工夫上都比其余现有的数据集更密集。每一帧的标注都思考到了相邻帧之间的关联性

特色

由 20 个 60 帧的序列组成,帧率为 30Hz

数据集分成训练集和测试集,训练集由 15 个序列组成,而测试集由剩下的五个序列组成

帧率为 30Hz 的短视频片段是在高速公路驾驶的状况下拍摄的

蕴含路线、车道、天空、栅栏、修建、交通标志、汽车、卡车、植被和未知 10 类标签。未知类包含未定义的物体、采集数据的车辆的引擎盖和含糊的边缘

03
「Wilddash」
公布方:奥地利技术研究所

下载地址:

https://wilddash.cc/accounts/…

论文地址:

https://openaccess.thecvf.com…

公布工夫:2018 年

大小:10.8G

简介:这是一个用于汽车畛域的语义和汽车畛域的实例宰割的新测试数据集。它具备以下长处:(i) 容许对失败的测试进行回溯,以发现视觉上的危险因素; (ii) 减少负面的测试案例,以防止假阳性; (iii)具备低区域偏差和低相机设置偏差

特色

蕴含了寰球多样性的交通状况,包含来自世界各地的测试案例

通过领有大量来自不同国家的路线场景、路线布局以及天气和照明条件,缩小了数据集的偏差

具备视觉危害和改良的元信息的场景,为每个测试图像说明涵盖了哪些危害

标注:路线、人行道、停车场、铁轨、人、骑手、汽车、卡车、公共汽车、铁轨、摩托车、自行车、大篷车、建筑物、墙壁、栅栏、护栏、桥梁、隧道、电线杆、交通标志、交通灯、植被、地形、天空、高空、动静和动态

包含负面的算法失败的测试案例

04
「IDD」
公布方:IIIT Hyderabad

下载地址:

http://idd.insaan.iiit.ac.in/…

论文地址

https://sci-hub.se/10.1109/wa…

公布工夫:2018 年

简介:这是一个用于了解非结构化环境中的路线场景的数据集,它反映了与现有数据集显著不同的路线场景的标签散布

特色

由 10,004 张图像组成,用 34 个类别进行精密标注,这些类别采集于印度公路上的 182 个驾驶序列(完)

分辨率以 1080p 为主,也有 720p 和其余分辨率的图像

采集环境:海德拉巴、班加罗尔等城市及其市区,采纳车载摄像机拍摄

05
「Mapillary Vistas」
公布方:IIIT Hyderabad

下载地址:

https://www.mapillary.com/

论文地址:

https://openaccess.thecvf.com…

公布工夫:2017 年

简介:这是一个新鲜的大规模街道级图像数据集,通过应用多边形来描述单个对象,以精密和细粒度的款式执行正文

特色

蕴含 25,000 个高分辨率图像,标注为 66 个对象类别,另有 37 个类别的特定实例的标签

采集地点:欧洲、北美和南美、亚洲、非洲和大洋洲的局部地区

采集环境:不同的天气,如晴天、雨天、阴天、雾天;不同的光照条件,如拂晓、傍晚、夜晚

采集设施:手机、平板电脑、动作相机、业余拍摄设施

06
「Cityscapes」
公布方:戴姆勒公司

下载地址:

https://www.cityscapes-datase…

论文地址:https://openaccess.thecvf.com…

公布工夫:2016 年

简介:专一于对城市街景的语义了解。大型数据集,蕴含从 50 个不同城市的街景中记录的各种平面视频序列

特色

领有 5000 张在城市环境中驾驶场景的图片,具备 19 个类别的密集像素标注,其中 8 个具备实例级宰割

一张图片的标注和品质管制均匀须要 1.5 小时

高质量的像素级正文为 5000 帧,另外 20000 个弱正文帧

标注类别:立体、修建、天然、车辆、天空、物体、人类和空洞

标注图像分为训练组、验证组和测试组

07
「Lost And Found」
公布方:戴姆勒公司

下载地址:

https://www.6d-vision.com/cur… research/lostandfounddataset

论文地址:

https://arxiv.org/pdf/1609.04…

公布工夫:2016 年

简介:关注于检测路线上由失落货物引起的意外小障碍物的问题。数据应用 ZED 被动双目采集,共有 2104 标注好的数据。数据提出后的几年有多个数据集效仿(如 seg me if you can、SOD),同时有 40+ 的算法将此数据集作为 benchmark

特色

蕴含 112 个平面视频序列和 2104 个带正文的帧(从记录的数据中大概每十分之一帧筛选一次)

在 200 万像素的平面图像上,帧率高达 20 赫兹

包含 13 个不同街道场景的记录,具备 37 种不同的障碍物类型

选定场景蕴含非凡的挑战,包含不规则的路线轮廓、远距离、不同的路面外观和强烈的光照变动

平面相机设置的基线为 21 厘米,焦距为 2300 像素,空间和辐射测量分辨率为 2048×1024 像素和 12 比特

08

「LaRA:交通信号灯视频数据集」
公布方:斯坦福大学

下载地址:

http://ai.stanford.edu/~jkrau…

论文地址:

https://sci-hub.se/10.1109/ic…

公布工夫:2011 年

简介:提供了一种新的轨迹分类办法,办法基于数学原理上的组合对数几率,能对所有可见物体的轨迹进行分类,速度快到能够实时应用,对物体类别没有特异性

特色

包含约 130 万个标记的点云,这些点云在一个自主车辆钻研平台上记录了约 14,000 条轨迹

标注分类:汽车、行人、骑自行车者和背景

采集地点:忙碌的校园街道和交叉路口

09
「CamVid」
公布方:剑桥大学

下载地址:

http://mi.eng.cam.ac.uk/resea…

论文地址:

https://sci-hub.se/10.1016/j….

简介:第一个具备对象类语义标签的视频汇合,其中蕴含元数据。数据集提供根底事实标签,将每个像素与 32 个语义类之一相关联。该数据库解决了对试验数据的需要,以定量评估新兴算法。尽管大多数视频都应用固定地位的闭路电视格调相机拍摄,但该数据是从驾驶汽车的角度拍摄的。驾驶场景减少了察看对象类的数量和异质性

特色

提供超过 10 分钟的高质量 30Hz 间断镜头,对应的语义标记图像为 1Hz,局部为 15Hz

包含四个高清视频序列,它们的名称和持续时间(分钟:秒)是 0001TP(8:16),0006R0(3:59),0016E5(6:19)和 Seq05VD(3:40),总的持续时间为 22:14。0001TP 序列是在黄昏时分拍摄的,场景中的物体能够场景中的物体依然能够被辨认,但比其余序列中的物体显著更暗,更有颗粒感。其余三个序列是在白天拍摄的,天气相当晴朗

采集环境:混合的城市和住宅

首先手动指定 700 多幅图像的逐像素语义宰割,而后由第二个人查看并确认其准确性

拍摄了相机色彩响应和外部物理的标定序列,并计算了序列中每一帧的三维相机姿势

采集设施:车载摄像机

提供了定制的标签软件,帮忙用户为其余图像和视频绘制准确的类标签

END

正文完
 0