关于自动驾驶:最全自动驾驶数据集分享系列一｜目标检测数据集23

目前对于主动驾驶数据集你想晓得的，应该都在这里了，这是「整数智能」主动驾驶数据集八大系列分享之系列一：

「本期划重点」

清华大学推出 寰球首个 车路协同主动驾驶钻研数据集
Nexar 视频数据集笼罩 70 多个国家，1400 多个城市
行人指标检测数据集一览：KAIST、ETH、Daimler、Tinghua-Daimler、Caltech、NightOwls、ECP
夜间图像也清晰可见：Kaist 行人数据集、FLIR 热成像数据集、东京大学红外数据集

主动驾驶数据集分享是整数智能推出的一个全新分享系列，在这个系列中，咱们将介绍目前为止各大科研机构和企业推出的所有公开主动驾驶数据集。数据集次要分为八个系列：

系列一：指标检测数据集 🔗
系列二：语义宰割数据集
系列三：车道线检测数据集
系列四：光流数据集
系列五：Stereo Dataset
系列六：定位与地图数据集
系列七：驾驶行为数据集
系列八：仿真数据集

本文是 < 系列一指标检测数据集 > 的第二篇，一共分为三篇来介绍。

上面共包含 15 个数据集：

公布方：清华大学智能产业研究院（AIR）、北京市高级别主动驾驶示范区、北京车网科技倒退有限公司、百度 Apollo、北京智源人工智能研究院
下载地址：https://thudair.baai.ac.cn/co…
公布工夫：2022 年
简介：DAIR-V2X 数据集是寰球首个用于车路协同主动驾驶钻研的大规模、多模态、多视角数据集，全副数据采集自实在场景，同时蕴含 2D&3D 标注
特色
- 总计 71254 帧图像数据和 71254 帧点云数据
```
*   DAIR-V2X 协同数据集(DAIR-V2X-C)，蕴含 38845 帧图像数据和 38845 帧点云数据
*   DAIR-V2X 路端数据集(DAIR-V2X-I)，蕴含 10084 帧图像数据和 10084 帧点云数据
*   DAIR-V2X 车端数据集(DAIR-V2X-V)，蕴含 22325 帧图像数据和 22325 帧点云数据
```
- 首次实现车路协同时空同步标注
- 传感器类型丰盛，蕴含车端相机、车端 LiDAR、路端相机和路端 LiDAR 等类型传感器
- 障碍物指标 3D 标注属性全面，标注 10 类路线常见障碍物指标
- 采集自北京市高级别主动驾驶示范区 10 公里城市道路、10 公里高速公路、以及 28 个路口
- 数据涵盖晴天 / 雨天 / 雾天、白天 / 夜晚、城市道路 / 高速公路等丰盛场景
- 数据齐备，蕴含脱敏后的原始图像和点云数据、标注数据、工夫戳、标定文件等
- 训练集和验证集已公布，测试集将伴随后续 Challenge 流动公布

公布方：Argo AI、卡内基梅隆大学、佐治亚理工学院
下载地址：https://www.argoverse.org/av1…
论文地址：https://arxiv.org/pdf/1911.02…
公布工夫：2019 年
简介：Argoverse 数据集蕴含 3D Tracking 和 Motion Forecasting 两局部。Argoverse 数据集与 Waymo 有些不同，尽管它也蕴含激光雷达和摄像头数据，但它只笼罩了在迈阿密和匹兹堡记录的 113 个场景。其特别之处在于，它是第一个蕴含高清地图数据的数据集
特色
- 第一个蕴含高清地图数据的数据集：蕴含匹兹堡和迈阿密 290 公里的车道地图，如地位、连贯、交通信号、海拔等信息
- 传感器：2 个激光雷达，7 个高分辨率环形相机 (1920 × 1200)，2 个平面相机（2056 × 2464）
- Argoverse 3D tracking
- 蕴含 113 个场景的 3d 跟踪正文，每个片段长度为 15-30 秒，共计蕴含 11052 个跟踪对象
- 对 5 米内的物体进行标注，共 15 个标签
- 70% 的标注对象为车辆，30% 行人、自行车、摩托车等
- Argoverse Motion Forecasting
- 从在迈阿密和匹兹堡的 1006 小时驾驶记录中获取，总计 320 小时
- 蕴含 324,557 个场景，每个场景 5 秒，且蕴含以 10 Hz 采样的每个跟踪对象的 2D 鸟瞰图

公布方：韩国科学技术院（Korea Advanced Institute of Science and Technology）
下载地址 1：https://sites.google.com/site…
下载地址 2：https://sites.google.com/site…
论文地址：https://openaccess.thecvf.com…\_cvpr\_2015/papers/Hwang\_Multispectral\_Pedestrian\_Detection\_2015\_CVPR\_paper.pdf
公布工夫：2015 年
简介：该数据集为多光谱行人检测数据集，提供白天和夜晚的黑白 - 热成像图像对。数据集通过彩色图像和热成像的优势互补，进步了行人检测的准确度，克服了以往行人检测数据行人被遮挡、背景凌乱、夜间成像不清晰等问题
特色
- 同时提供白天和夜间的 95328 对黑白 - 热成像图像，并且通过分束器的解决对齐图像，打消图像视差
- 数据采集地点为韩国首尔，图像分辨率为 640×480
- 103,128 个人工 2D 框标注，1,182 个行人
- 四种不同类型的标注：person、people（不清晰的人像）、cyclist、person?（不确定是否为行人）
- 采集设施：蕴含热成像仪、RGB 摄像机、分束器等的采集设施

公布方：苏黎世联邦理工大学 (ETH Zürich)
下载地址：https://icu.ee.ethz.ch/resear…
论文地址：https://www.vision.rwth-aache…
公布工夫：2009 年
简介：ETH 是一个行人检测数据集，应用摄像机拍摄共三个视频片段，数据集只有一个行人标签
特色
- 测试集蕴含 3 个视频片段，共 4800 帧，帧率为 15，共 1894 个标注
- 应用 2.5D 标注，进行抽帧标注，每四帧标注一次
- 采集于瑞士苏黎世人员密集的街区
- 应用摄像机进行拍摄

公布方：Daimler AG
下载地址：http://www.lookingatpeople.co…
论文地址：http://gavrila.net/pami09.pdf
公布工夫：2008 年
大小：8.5GB
简介：戴姆勒行人检测数据集是采集于城市环境的行人检测数据集，采集的环境均为白天。数据集分为训练集和测试集两局部，训练集又包含行人图像和不蕴含行人的图像
特色
- 27 分钟的视频片段
- 15560 张行人的图像（剪切后分辨率为 48×96），6744 张不蕴含行人的图片
- 21,790 张图片(640×480 分辨率)，56,492 个 2D 人工标注
- 视频通过行驶车辆上的摄像头采集，场景全副为日间城市道路

公布方：Daimler AG、清华大学
下载地址：http://www.lookingatpeople.co…
论文地址：http://www.gavrila.net/Public…\_cyclist\_benchmark.pdf
公布工夫：2016 年
简介：该数据集旨在丰盛骑行者的数据，进步主动驾驶算法对骑行者检测的准确度，在此之前还没有推出过专门针对骑行者指标检测的数据集
特色
- 将近 6 个小时的视频数据，分辨率为 2048×1024
- 14674 帧带标注数据，32361 个标注对象，包含骑行者、行人和其余骑行者
- 数据集分为局部标注数据集和全副标注数据集。局部标注数据集只包含残缺清晰的骑行者，而后者包含行人、自行车、三轮车、轮椅、摩托车等所有骑行者
- 应用车载平面相机进行采集，采集地点为北京的海淀区和朝阳区

公布方：加州理工学院（California Institute of Technology）
下载地址：http://www.vision.caltech.edu…\_Datasets/CaltechPedestrians/
论文地址：http://www.vision.caltech.edu…\_Datasets/CaltechPedestrians/files/CVPR09pedestrians.pdf
公布工夫：2009 年
简介：加州理工学院行人数据集采集于洛杉矶的城市道路，视频数据通过车辆搭载摄像头采集
特色
- ‍蕴含将近 10 个小时的 640×480 30Hz 数据集
- 数据集分为训练集和测试集，训练集分为 6 个子集，测试集分为 4 个子集，每个子集大小大概为 1GB
- 蕴含大概 250,000 帧行人标注数据，350,000 个 2D 框，2300 个行人，总时长大概为 137 分钟
- 辨别标注行人的可见局部和不可见局部
- 视频采集于洛杉矶行人较多的六个区：LAX, Santa Monica, Hollywood, Pasadena, and Little Tokyo

公布方：Oxford Visual Geometry Group
下载地址：https://www.nightowls-dataset…
论文地址：https://www.robots.ox.ac.uk/~…
公布工夫：2018 年
简介：NightOwls 数据集次要提供夜间的行人数据。与白天相比，夜间照明度差，反射、含糊和对比度变动多，因而夜间行人检测更具挑战性
特色
- 279,000 帧数据，图像分辨率为 1024 x 640，帧率为 15
- 所有帧都带有 2D 框标注，且带有追踪信息，蕴含 42,273 个行人
- 四种行人标签：Pedestrians、Bicycledriver、Motorbikedriver、Ignore areas
- 四类标签属性：Pose、Difficulty、Occlusion、Truncation
- 多样性：笼罩三个国家（德国、英国、荷兰），春夏秋冬四个节令，拂晓和夜晚，不同的天气状况如雨雪天气

公布方：代尔夫特理工大学 (Delft University of Technology (TU Delft))
下载地址：https://eurocity-dataset.tude…\_next=/eval/downloads/detection
论文地址：https://arxiv.org/pdf/1805.07193;The
公布工夫：2018 年
简介：ECP 是一个多元化的行人检测数据集，数据收集于欧洲多个国家，由车载摄像头进行收集
特色
- 大型多样化数据集：笼罩 4 个节令、12 个国家、31 个城市、47300 张图像、238200 集体
- 标签分为行人和骑行者两类，骑行者又进一步分为自行车、婴儿车、摩托车、滑板车、三轮车、轮椅等类型
- 对骑行者的标注分两局部：对人的标注以及骑行工具的标注
- 标注信息除了 2D 框之外，还包含定位信息

公布方：机器人和平面视觉小组（The Robotics and Tridimensional Vision Group, RoViT，University of Alicante）
下载地址：http://www.rovit.ua.es/datase…（邮件分割获取）
论文地址：https://www.mdpi.com/2079-929…
公布工夫：2018 年
简介：该数据集中的数据来自于现有数据集，例如 PASCAL VOC、UDacity、Sweden，同时通过装置在车辆上的高清摄像头收集了一部分数据（1% 左右），该数据集在公开数据集等的根底上减少了标签的类别。其中有一些数据为弱标注数据，能够用于测试弱监督学习技术
特色
- 数据集被分成两局部：traffic objects 和 traffic signs
- traffic objects 数据集经 2D 标注，共包含汽车、摩托车、人、信号灯、公交车、自行车和交通标志
- traffic signs 总共蕴含 43 种欧洲街道常见的交通标志，数据来自 GTSRB 以及 Sweden
- 共蕴含 12000 个交通标志

公布方：东京大学
下载地址：https://github.com/sekilab/Ro…
论文地址：
- https://arxiv.org/abs/1801.09454
- https://www.sciencedirect.com…
公布工夫：2018-2020
简介
- Road Damage Dataset 2018：该数据集第一次收集了大规模的路线损坏数据集，收集了日本 7 个城市共 40 多个小时的数据。由装置在汽车上的智能手机拍摄的 9,053 张路线病害图像组成，这些路线图像中蕴含 15,435 个路面病害实例，蕴含 8 种病害类型。每幅图像中，路线病害地位和病害类型都被标注进去
- Road Damage Dataset 2020：该数据集应用车载智能手机拍摄，蕴含来自印度、日本和捷克共和国的 26,336 张路线图像，其中有超过 31,000 个路线损坏实例。该数据集收集了四种类型的路线损坏：纵向裂缝、横向裂缝、鳄鱼裂缝和坑洼

公布方：Teledyne FLIR
下载地址：https://www.flir.eu/oem/adas/…
公布工夫：2018 年
大小：17GB
简介：感知热红外辐射或热量的能力为现有传感器技术（如可见光相机、激光雷达和雷达零碎）提供了互补和独特的劣势。该数据集通过热传感技术提供了热图像，在齐全乌黑、烟雾、顽劣天气和眩光等具备挑战性的天气条件下，可检测并辨别行人、骑行者、动物和机动车辆，促成可见光 + 热传感器交融算法 (“RGBT”) 的研究进展
特色
- 26,442 个齐全标注的帧，520,000 个 2D 框，9,711 张热图像和 9,233 张 RGB 图像
- 15 个标签类别：行人、自行车、汽车、摩托车、公共汽车、火车、卡车、红绿灯、消防栓等
- 热成像仪规格：Teledyne FLIR Tau 2 640×512，13mm f/1.0

公布方：Tusimple
下载地址：https://github.com/TuSimple/t…
公布工夫：2017 年
简介：Tusimple 举办了一次以摄像头图像数据做车道检测的较量, 公开了一部分数据及其标注信息
特色
- 7,000 个 1 秒长的视频片段，每个片段 20 帧
- 环境特色：白天，良好或中等的天气，高速公路
- 训练集蕴含 3626 个视频片段，测试集蕴含 2782 个视频片段
- 采纳线标注，每条线实际上是点序列的坐标汇合，而不是区域汇合

公布方：Nexar
下载地址：https://www.kaggle.com/solese…
公布工夫：2017 年
大小：11G
简介：Nexar 蕴含丰盛和多样化路线数据，采纳行车记录仪和手机摄像头等拍摄，是目前为止涵盖最多国家和城市的主动驾驶数据集
特色
- 超过 2500000 个小时的视频，50000 张带有 2D 框标注图像的训练集，蕴含 41190 张图像的测试汇合
- 多样化：笼罩 77 个国家，1400 多个城市，三种照明条件（白天、夜晚、傍晚），四个节令，多种路况（城市、农村、高速、居民区甚至包含沙漠路线），多种天气状况（晴、雾、雨、雪）
- 标注：采纳 2D 标注，2D 框与车辆不齐全贴合

公布方：东京大学
下载地址：https://drive.google.com/driv…
论文地址：https://dl.acm.org/doi/pdf/10…
公布工夫：2017 年
大小：6.85GB
简介：该数据集由 RGB 图像、近红外图像、中红外图像和远红外图像组成，图片拍摄于校园环境
特色
- 7,512 张图片，3,740 张日间的图片以及 3,772 张夜间图片
- 采集：图片由 RGB、近红外相机、中红外相机和远红外相机获取，为了模仿驾驶环境，相机被装置在一辆小推车上
- 环境：东京的大学校园，包含白天和夜晚的数据
- 标注：蕴含 2D 框及标签，包含行人、自行车、车辆等障碍物

整数智能心愿通过在数据处理畛域的业余能力，在将来三年，赋能 1000+ 以上的 AI 企业，成为这些企业的「数据合伙人」，因而咱们十分期待能与正在浏览这篇文章的您，有进一步的沟通交流，欢送分割咱们，一起摸索更多单干可能性，咱们的联系方式如下：

联系人：祁学生

电话：13456872274

更多详情可拜访整数智能官网：www.molardata.com

关于自动驾驶:最全自动驾驶数据集分享系列一｜目标检测数据集23

「八大系列概览」

01「DAIR-V2X 数据集」

02「Argoverse」

03「KAIST Multispectral Pedestrian」

04「ETH Pedestrian」

05「Daimler Pedestrian」

06「Tsinghua-Daimler Cyclist」

07「Caltech 数据集」

08「NightOwls」

09「EuroCity Persons Dataset」

10「Urban Object Detection」

11「Road Damage Dataset 2018-2020」

12「FLIR Thermal Sensing」

13「TuSimple 车道线检测数据集」

14「NEXET」

15「Multi-spectral Object Detection」

「分割咱们」

Just My Socks（注册教程内含优惠码）

关于自动驾驶:最全自动驾驶数据集分享系列一｜目标检测数据集23

「八大系列概览」

01「DAIR-V2X 数据集」

02「Argoverse」

03「KAIST Multispectral Pedestrian」

04「ETH Pedestrian」

05「Daimler Pedestrian」

06「Tsinghua-Daimler Cyclist」

07「Caltech 数据集」

08「NightOwls」

09「EuroCity Persons Dataset」

10「Urban Object Detection」

11「Road Damage Dataset 2018-2020」

12「FLIR Thermal Sensing」

13「TuSimple 车道线检测数据集」

14「NEXET」

15「Multi-spectral Object Detection」

「分割咱们」

Just My Socks（注册教程 内含优惠码）

Just My Socks（注册教程内含优惠码）