关于自动驾驶:最全自动驾驶数据集分享系列二-语义分割数据集

目前对于主动驾驶数据集你想晓得的，应该都在这里了，这是「整数智能」主动驾驶数据集八大系列分享之系列二：

「本期划重点」
波恩大学推出迄今为止最大的领有序列信息的数据集SemanticKITTI

韩国科学技术院公布Highway Driving，该数据集提供的标注在空间上和工夫上都比其余现有的数据集更密集

剑桥大学推出CamVid，提供第一个具备对象类语义标签的视频汇合

「八大系列概览」
主动驾驶数据集分享是整数智能推出的一个全新分享系列，在这个系列中，咱们将介绍目前为止各大科研机构和企业推出的所有公开主动驾驶数据集。数据集次要分为八个系列：
系列一：指标检测数据集

系列二：语义宰割数据集

系列三：车道线检测数据集

系列四：光流数据集

系列五：Stereo Dataset

系列六：定位与地图数据集

系列七：驾驶行为数据集

系列八：仿真数据集

本文是<系列二语义宰割数据集>，上面共包含9个数据集：

01
「SemanticKITTI」
公布方：波恩大学 (University of Bonn)
下载地址：
http://www.semantic-kitti.org...
论文地址：
https://www.researchgate.net/...
公布工夫：2019年
简介：SemanticKITTI是KITTI在语义宰割方向的子数据集，是激光雷达语义宰割的重要基准之一，是迄今为止最大的领有序列信息的数据集。它对 KITTI Vision Odometry Benchmark 中的所有序列都进行了标注，并为所用汽车激光雷达的残缺360°视线提供了密集的逐点标注。基于该数据集，研发团队提出了三个基准工作：（i）应用单次扫描对点云进行语义宰割，（ii）应用序列计算多个过来扫描的语义分段，（iii）语义场景实现
特色

提供23 201 次全 3D 扫描用于训练，20 351 次用于测试

该数据集蕴含 28 个标注类别，分为动态对象和动静对象，既包含行人、车辆等交通参与者，也包含停车场、人行道等高空设施

数据集包含518块瓷砖，共计超过1700个小时的标注工作

研发团队还将数据采集过程中用到的点云标记工具进行了开源

02
「Highway Driving」
公布方：韩国科学技术院（Korea Advanced Institute of Science and Technology）

下载地址：

https://sites.google.com/site...

论文地址

https://arxiv.org/pdf/2011.00...

公布工夫：2019年

简介：高速公路驾驶数据集是一个密集标注的语义视频宰割工作的基准，它所提供的标注在空间上和工夫上都比其余现有的数据集更密集。每一帧的标注都思考到了相邻帧之间的关联性

特色

由20个60帧的序列组成，帧率为30Hz

数据集分成训练集和测试集，训练集由15个序列组成，而测试集由剩下的五个序列组成

帧率为30Hz的短视频片段是在高速公路驾驶的状况下拍摄的

蕴含路线、车道、天空、栅栏、修建、交通标志、汽车、卡车、植被和未知10类标签。未知类包含未定义的物体、采集数据的车辆的引擎盖和含糊的边缘

03
「Wilddash」
公布方：奥地利技术研究所

下载地址：

https://wilddash.cc/accounts/...

论文地址：

https://openaccess.thecvf.com...

公布工夫：2018年

大小：10.8G

简介：这是一个用于汽车畛域的语义和汽车畛域的实例宰割的新测试数据集。它具备以下长处：(i) 容许对失败的测试进行回溯，以发现视觉上的危险因素; (ii) 减少负面的测试案例，以防止假阳性; (iii)具备低区域偏差和低相机设置偏差

特色

蕴含了寰球多样性的交通状况，包含来自世界各地的测试案例

通过领有大量来自不同国家的路线场景、路线布局以及天气和照明条件，缩小了数据集的偏差

具备视觉危害和改良的元信息的场景，为每个测试图像说明涵盖了哪些危害

标注：路线、人行道、停车场、铁轨、人、骑手、汽车、卡车、公共汽车、铁轨、摩托车、自行车、大篷车、建筑物、墙壁、栅栏、护栏、桥梁、隧道、电线杆、交通标志、交通灯、植被、地形、天空、高空、动静和动态

包含负面的算法失败的测试案例

04
「IDD」
公布方：IIIT Hyderabad

下载地址：

http://idd.insaan.iiit.ac.in/...

论文地址

https://sci-hub.se/10.1109/wa...

公布工夫：2018年

简介：这是一个用于了解非结构化环境中的路线场景的数据集，它反映了与现有数据集显著不同的路线场景的标签散布

特色

由10,004张图像组成，用34个类别进行精密标注，这些类别采集于印度公路上的182个驾驶序列（完）

分辨率以1080p为主，也有720p和其余分辨率的图像

采集环境：海德拉巴、班加罗尔等城市及其市区，采纳车载摄像机拍摄

05
「Mapillary Vistas」
公布方：IIIT Hyderabad

下载地址：

https://www.mapillary.com/

论文地址：

https://openaccess.thecvf.com...

公布工夫：2017年

简介：这是一个新鲜的大规模街道级图像数据集，通过应用多边形来描述单个对象，以精密和细粒度的款式执行正文

特色

蕴含25,000个高分辨率图像，标注为66个对象类别，另有37个类别的特定实例的标签

采集地点：欧洲、北美和南美、亚洲、非洲和大洋洲的局部地区

采集环境：不同的天气，如晴天、雨天、阴天、雾天；不同的光照条件，如拂晓、傍晚、夜晚

采集设施：手机、平板电脑、动作相机、业余拍摄设施

06
「Cityscapes」
公布方：戴姆勒公司

下载地址：

https://www.cityscapes-datase...

论文地址：https://openaccess.thecvf.com...

公布工夫：2016年

简介：专一于对城市街景的语义了解。大型数据集，蕴含从50个不同城市的街景中记录的各种平面视频序列

特色

领有5000张在城市环境中驾驶场景的图片，具备19个类别的密集像素标注，其中8个具备实例级宰割

一张图片的标注和品质管制均匀须要1.5小时

高质量的像素级正文为5000帧，另外20000个弱正文帧

标注类别：立体、修建、天然、车辆、天空、物体、人类和空洞

标注图像分为训练组、验证组和测试组

07
「Lost And Found」
公布方：戴姆勒公司

下载地址：

https://www.6d-vision.com/cur... research/lostandfounddataset

论文地址：

https://arxiv.org/pdf/1609.04...

公布工夫：2016年

简介：关注于检测路线上由失落货物引起的意外小障碍物的问题。数据应用ZED被动双目采集，共有2104标注好的数据。数据提出后的几年有多个数据集效仿（如seg me if you can 、SOD），同时有40+的算法将此数据集作为benchmark

特色

蕴含112 个平面视频序列和 2104 个带正文的帧（从记录的数据中大概每十分之一帧筛选一次）

在200万像素的平面图像上，帧率高达20赫兹

包含13个不同街道场景的记录，具备37种不同的障碍物类型

选定场景蕴含非凡的挑战，包含不规则的路线轮廓、远距离、不同的路面外观和强烈的光照变动

平面相机设置的基线为21厘米，焦距为2300像素，空间和辐射测量分辨率为2048×1024像素和12比特

「LaRA ：交通信号灯视频数据集」
公布方：斯坦福大学

下载地址：

http://ai.stanford.edu/~jkrau...

论文地址：

https://sci-hub.se/10.1109/ic...

公布工夫：2011年

简介：提供了一种新的轨迹分类办法，办法基于数学原理上的组合对数几率，能对所有可见物体的轨迹进行分类，速度快到能够实时应用，对物体类别没有特异性

特色

包含约130万个标记的点云，这些点云在一个自主车辆钻研平台上记录了约14,000条轨迹

标注分类：汽车、行人、骑自行车者和背景

采集地点：忙碌的校园街道和交叉路口

09
「CamVid」
公布方：剑桥大学

下载地址：

http://mi.eng.cam.ac.uk/resea...

论文地址：

https://sci-hub.se/10.1016/j....

简介：第一个具备对象类语义标签的视频汇合，其中蕴含元数据。数据集提供根底事实标签，将每个像素与32个语义类之一相关联。该数据库解决了对试验数据的需要，以定量评估新兴算法。尽管大多数视频都应用固定地位的闭路电视格调相机拍摄，但该数据是从驾驶汽车的角度拍摄的。驾驶场景减少了察看对象类的数量和异质性

特色

提供超过10分钟的高质量30Hz间断镜头，对应的语义标记图像为1Hz，局部为15Hz

包含四个高清视频序列，它们的名称和持续时间（分钟：秒）是0001TP（8:16），0006R0（3:59），0016E5（6:19）和Seq05VD（3:40），总的持续时间为22:14。0001TP序列是在黄昏时分拍摄的，场景中的物体能够场景中的物体依然能够被辨认，但比其余序列中的物体显著更暗，更有颗粒感。其余三个序列是在白天拍摄的，天气相当晴朗

采集环境：混合的城市和住宅

首先手动指定700多幅图像的逐像素语义宰割，而后由第二个人查看并确认其准确性

拍摄了相机色彩响应和外部物理的标定序列，并计算了序列中每一帧的三维相机姿势

采集设施：车载摄像机

提供了定制的标签软件，帮忙用户为其余图像和视频绘制准确的类标签

END