关于人工智能:来自不同行业领域的50多个对象检测数据集

75次阅读

共计 9377 个字符,预计需要花费 24 分钟才能阅读完成。

作者 |Abhishek Annamraju
编译 |Flin
起源 |medium

计算机视觉是一个疾速倒退的畛域,每天都有大量的新技术和算法呈现在不同的会议和期刊上。说到指标检测,实践上你会学到很多算法,比方 Faster-rcnn、Mask rcnn、Yolo、SSD、Retinenet、级联 rcnn、Peleenet、EfficientDet、CornerNet…。这张算法清单是永远列不完的!

通过将其利用到不同的数据集来坚固你的学习教训总是无益的!!!

这样一来,你往往会更好地了解算法,并且能够直观理解哪些算法能够在哪种数据集上运行。

咱们在 Monk Computer Vision Org 的开源团队编制了一个对象检测,图像宰割和动作辨认数据集的列表,并针对每个对象创立了简短的教程,供你应用这些数据集并尝试不同的对象检测算法

上面提到的是对象检测数据集的简短列表,无关它们的简短详细信息以及应用它们的步骤。数据集来自以下畛域:

★农业
★高级驾驶员辅助和主动驾驶汽车零碎
★时尚,批发和营销
★野生动物
★体育
★卫星成像
★医学成像
★平安和监督
★水下成像

….. 以及更多!!!!!

残缺列表可在 github 上找到相干的应用阐明和训练代码

  • https://github.com/Tessellate…

与农业无关的数据集

A)Winegrape 检测数据集

  • https://github.com/thsant/wgisd

* 指标:检测葡萄园中的葡萄簇

* 利用:监测成长并剖析产量

* 详细信息:300 幅图像,带有 5 个葡萄类别的 4400 个边界框

* 如何利用数据集并应用 YoloV3 管道构建自定义检测器

  • https://github.com/Tessellate…

B)寰球小麦检测数据集

  • https://www.kaggle.com/c/glob…

* 指标:检测田间的小麦作物

* 利用:监测成长并剖析产量

* 详细信息:带有 100K + 批注的 3430 图像

* 如何利用数据集并应用 EfficientDet-D4 管道构建自定义检测器

  • https://github.com/Tessellate…

先进的驾驶员辅助和主动驾驶汽车零碎相干数据集

A)LISA 交通标志检测数据集

  • http://cvrr.ucsd.edu/LISA/lis…

* 指标:用于检测和分类行车记录仪图像中的交通标志

* 利用:交通标志辨认是主动驾驶的规定设置程序

* 详细信息:在 47 种美国标记类型上的 6610 帧上有 7855 个正文

* 如何利用数据集并建设自定义应用 EfficientDet-D3 管线的探测器

  • https://github.com/Tessellate…

* 此存储库又多了一个数据集

  • LISA 车辆检测数据

    • http://cvrr.ucsd.edu/LISA/veh…

B)低光照条件下的物体检测

  • https://github.com/cs-chan/Ex…

* 指标:在低光照条件下检测路线上的物体——雾,雾霾,下雨等

* 利用:这是主动驾驶汽车中的重要组成部分,因为它可能检测物体,因而在不利条件下属于更平安的车辆

* 细节:在 12 种不同对象类型上的 7500 帧上的 15K + 正文

* 如何利用数据集和应用 EfficientDet-D3 管道构建自定义检测器

  • https://github.com/Tessellate…

C)LARA 交通灯检测数据集

  • http://www.lara.prd.fr/benchm…

* 指标:检测交通信号灯并将其分类为红色,绿色和黄色

* 应用程序:能够为路线网络交叉口的 adas 和主动驾驶汽车零碎设置规定

* 详细信息:三种交通类型的 11K 帧和 20K + 正文灯光

* 如何利用数据集并建设应用 Mmdet-Faster-Rcnn-fpn50 管道自定义检测

  • https://github.com/Tessellate…

D)应用红外图像进行人检测

  • https://camel.ece.gatech.edu/

* 指标:用于检测红外图像中的人

* 利用:主动驾驶汽车装备了红外摄像头以检测顽劣条件下的物体

* 详细信息:30 个带有 1K + 正文的视频序列

* 如何利用数据集并应用 Mx-Rcnn 管道构建自定义检测器

  • https://github.com/Tessellate…

E)坑洼检测数据集

  • https://www.kaggle.com/chitho…

* 指标:从路线图像中检测坑洼

* 利用:检测路线地形和坑洼可实现安稳行驶。

* 详细信息:700 个在坑洼处带有 3K + 正文的图像

* 如何利用数据集和应用 M -Rcnn 管道构建自定义检测器

  • https://github.com/Tessellate…

F)Nexet 车辆检测数据集

  • https://www.kaggle.com/solese…

* 指标:检测车辆的路线图像

* 利用:检测车辆是主动驾驶的次要组成部分

* 详细信息:7000 种图像,在 6 种类型的车辆上具备 15K + 正文

* 如何利用数据集并应用 Tensorflow Object Detection 构建自定义检测器 API

  • https://github.com/Tessellate…

G)BDD100K Adas 数据集

  • https://www.kaggle.com/solese…

* 指标:检测路线上的物体

* 利用:检测车辆,交通标志和人是主动驾驶的次要组成部分

* 详细信息:100K 图像,对 10 种类型的对象提供 250K + 正文

* 如何利用数据集并建设自定义应用 Tensorflow 对象检测 API 的检测器

  • https://github.com/Tessellate…

H)Linkopings 交通标志数据集

  • http://www.cvl.isy.liu.se/res…

* 指标:检测图像中的交通标志

* 利用:检测交通标志是理解交通规则的第一步

* 详细信息:3K 图像,对 40 多种类型的交通标志提供 5K + 正文

** 如何利用数据集并应用 Mmdet-Cascade Mask-Rcnn 构建自定义检测器

  • https://github.com/Tessellate…

时尚、批发和营销相干数据集

A)广告牌检测(二次采样 OpenImages 数据集)数据集

  • https://storage.googleapis.co…

* 指标:检测图像中的广告牌

* 应用程序:检测广告牌是主动剖析整个城市营销流动的要害局部

* 详细信息:2K 图像,广告牌上带有 5K + 正文

* 如何利用数据集并应用 Retinanet 构建自定义检测器

  • https://github.com/Tessellate…

B)DeepFashion2 时尚元素检测数据集

  • https://github.com/switchable…

* 指标:检测图像中的时尚产品,服装和配饰

* 应用程序:应用程序时尚检测有着从数据排序到举荐引擎的微小利用

* 详细信息:490K 图像,带有约 100 个正文对象类

* 如何利用数据集并建设自定义 CornetNet-Lite 管道检测仪

  • https://github.com/Tessellate…

* 另一个与时尚相干的数据集是淘宝商品数据集

  • http://www.sysu-hcp.net/taoba…

C)Qmul-OpenLogo 徽标检测数据集

  • https://qmul-openlogo.github.io/

* 指标:检测天然图像中的不同徽标

* 利用:剖析视频和天然场景中徽标呈现的频率对营销至关重要

* 详细信息:16K 训练图片,包含各种品牌的标识——食品、车辆、连锁餐厅、送货服务、航空公司等

* 如何利用数据集并应用 mx-rcnn 管道构建自定义检测器

  • https://github.com/Tessellate…

与体育相干的数据集

A)足球检测数据集(从 OpenImages 数据集进行二次采样)

  • https://storage.googleapis.co…

* 指标:在视频中跨帧检测足球

* 利用:检测足球地位在越位等主动剖析状况中至关重要

* 详细信息:约 3K 训练图像。

* 如何利用数据集并应用 yolo-v3 管道构建自定义检测器

  • https://github.com/Tessellate…

B)扑克牌类型检测

  • https://www.kaggle.com/luantm…

* 指标:检测天然图像中的纸牌并分类纸牌类型

* 利用:可能的利用是剖析不同纸牌游戏的获胜几率

* 详细信息:52 种纸牌类型中 500 张以上的图像

* 如何利用数据集并建设自定义应用 mx-rcnn 管道的检测器

  • https://www.kaggle.com/luantm…

C)热图像中的足球运动员检测

  • https://www.kaggle.com/aalbor…

* 指标:应用热图像定位和跟踪玩家

* 利用:跟踪游戏中的玩家是生成剖析的要害局部

* 详细信息:超过 5K + 正文的 3K + 图像。

* 如何利用数据集和应用 mmdet quick-rcnn 管道构建自定义检测器

  • https://github.com/Tessellate…

与平安和监督相干的数据集

A)CCTV 交通摄像头中的 MIO-TCD 车辆检测

* 指标:检测闭路电视摄像机中的车辆

* 利用:检测闭路电视摄像机中的车辆是安全监控利用中的要害局部

* 详细信息:113K 图像,在 5 种以上类型的车辆上具备 200K + 正文

* 如何利用数据集并应用 Mmdet-Retinanet 管道构建自定义检测器

  • https://github.com/Tessellate…

B)WIDER 人员检测数据集

  • https://wider-challenge.org/2…

* 指标:在闭路电视和天然场景图像和视频中检测人员

* 利用:基于 CCTV 的人员检测形成平安和监督应用程序的外围

* 详细信息:10K + 图像以及 20K + 正文可检测行人

* 如何利用数据集并建设自定义应用 Cornernet-Lite 管道的探测器

  • https://github.com/Tessellate…

C)防护配备 - 头盔和背心检测

  • https://github.com/ciber-lab/…

* 指标:检测人员的头盔和背心

* 利用:这是平安合规性监督中不可或缺的一部分

* 详细信息:1.5K + 图像以及 2K + 正文可检测人员,头盔和背心

* 如何利用数据集和构建自定义检测器应用 Mmdet — Cascade RPN

  • https://github.com/Tessellate…

D)视频中的异样检测

  • https://www.crcv.ucf.edu/proj…

* 指标:依据视频中执行的操作对视频进行分类

* 利用:实时检测异样有助于阻止立功

* 详细信息:对应于 10 个异样类别的 1K + 视频。

* 如何利用数据集和应用 mmaction-tsn50 管道构建自定义分类器

  • https://github.com/Tessellate…

医学影像数据集

A)超声臂丛神经(BP)神经宰割数据集

  • https://www.kaggle.com/c/ultr…

* 指标:在超声图像中宰割某些神经类型

* 利用:通过应用可阻塞或加重源头疼痛的留置导管,有助于改善疼痛治理。

* 详细信息:11K + 图像以及相干的实例蒙版,用于检测神经

* 如何利用数据集并构建自定义检测器

  • https://github.com/Tessellate…

B)细胞中的 PanNuke 癌症实例宰割

  • https://www.kaggle.com/andrew…

* 指标:在幻灯片图像中宰割不同的细胞类型

* 应用程序:主动剖析兆字节数据中癌细胞和死细胞的存在

* 详细信息:3K+ 图像,带有用于检测不同单元类型的关联实例掩码

* 如何利用数据集和构建定制检测器

  • https://github.com/Tessellate…

卫星成像数据集

A)卫星图像中的路线宰割

  • https://www.kaggle.com/insaff…

* 指标:在卫星图像中宰割道路线

* 利用:帮忙城市规划和路线监控

* 详细信息:1K + 图像和相干实例遮罩可检测不同的路线区域

* 如何利用数据集并构建自定义检测器

  • https://github.com/Tessellate…

B)在合成生成的月球图像中的可穿梭区域分割

  • https://www.kaggle.com/romain…

* 指标:宰割岩石并在月球影像中找到可穿梭的区域

* 利用:自主漫游车门路布局中的根本元素

* 详细信息:带有相干实例蒙版的 10K + 图像以检测不同的岩石和平坦的高空

* 如何利用数据集并构建定制检测器

C)卫星影像中的汽车和游泳池检测

  • https://www.kaggle.com/kbhart…

* 指标:在卫星图像中检测车辆和游泳池

* 利用:这是财产税估算中的要害局部

* 详细信息:3.5K+ 图片,汽车和游泳池上有 5K+ 正文标签

* 如何利用数据集并应用 cornernet lite 管道构建自定义检测器

  • https://github.com/Tessellate…

D)航空影像中的路线和居民区宰割

  • https://www.kaggle.com/cceekk…

* 指标:在卫星图像中宰割路线和居民区

* 利用:这是财产税估算中的要害局部

* 详细信息:带有宰割蒙版的 100 幅超高分辨率图像

* 如何利用数据集和构建自定义检测器

  • https://github.com/Tessellate…

* 另一个相似的路线宰割数据集和相干的训练代码

  • 数据集:https://www.kaggle.com/srikar…
  • 训练代码:https://github.com/Tessellate…

E)卫星图像中的水体宰割

  • https://www.kaggle.com/franci…

* 指标:在卫星图像中宰割水体

* 利用:理解水体如何随工夫变动和演变十分重要

- 带有宰割蒙版的 100 幅超高分辨率图像

* 如何利用数据集并构建自定义检测器

  • https://github.com/Tessellate…

* 另一个此类数据集是 DeepGlobe 土地笼罩分类及其相干的应用准则

  • 数据集:https://competitions.codalab….
  • 相干应用准则:https://github.com/Tessellate…

野生动物相干数据集

A)老虎检测数据集(从 OpenImages 采样)

  • https://storage.googleapis.co…

* 指标:检测天然和无人机图像中的老虎

* 利用:监督濒临灭绝的物种

* 详细信息:带有 4k + 正文的 2K + 图像。

* 如何利用数据集和应用 Cornernet-lite 管道构建自定义检测器

  • https://github.com/Tessellate…

* 另外一个这样的数据集能够是猴子检测数据集及其相干的教程

  • 猴子检测数据集:https://storage.googleapis.co…
  • 相干的教程:https://github.com/Tessellate…

B)斑马和长颈鹿检测数据集

  • https://lev.cs.rpi.edu/public…

* 指标:检测天然和无人机图像中的斑马和长颈鹿物种

* 利用:监督濒危物种

* 详细信息:带有 5k + 正文的 5K + 图像。

* 如何应用数据集并应用 efficiencydet-d3 管道构建自定义检测器

  • https://github.com/Tessellate…

C)加州理工学院相机陷阱数据集

  • https://beerys.github.io/Calt…

* 指标:检测陷阱照相机类型图像中的动物

* 利用:监督濒临灭绝的物种

* 详细信息:带有 8k + 正文的 10K + 图像。

* 如何利用数据集并应用 Retinanet 管道构建自定义检测器

  • https://github.com/Tessellate…

* 另外一个这样的相机数据集和相干的训练代码

  • 数据集:https://github.com/Tessellate…
  • 训练代码:https://github.com/Tessellate…

D)大象检测数据集(从 COCO 数据集中采样)

  • https://cocodataset.org/#down…

* 指标:检测天然和无人机图像中的大象品种

* 利用:监督濒临灭绝的物种

* 详细信息:带有 5k + 正文的 5K + 图像。

* 如何利用数据集并应用 mmdet-maskrcnn 构建自定义检测器

  • https://github.com/Tessellate…

水下数据集

A)在野外发现海龟

  • https://lev.cs.rpi.edu/public…

* 指标:检测水下图像中的海龟

* 利用:监督濒危物种

* 详细信息:带有 5k + 正文的 5K + 图像。

* 如何利用数据集并应用无效数据量构建自定义检测器

  • https://github.com/Tessellate…

* 相似的数据集,可监控水下鱼类

  • http://groups.inf.ed.ac.uk/f4…

相干代码

  • https://github.com/Tessellate…

B)水下垃圾检测数据集

  • https://conservancy.umn.edu/h…

* 指标:检测陆地垃圾

* 利用:监督和管制陆地垃圾问题

* 详细信息:带有 5k + 正文的 2K + 图像。

* 如何利用数据集并应用无效数据量构建自定义检测器

  • https://github.com/Tessellate…

* 更简单的基于像素的垃圾分类数据集和相干代码

  • 垃圾分类数据集:https://conservancy.umn.edu/h…
  • 相干代码:https://github.com/Tessellate…

C)SUIM 水下物体检测数据集

  • http://irvlab.cs.umn.edu/reso…

* 指标:宰割水下物体

* 利用:自主水下航行器的门路布局,跟踪潜水员和监督陆地物种

* 详细信息:1.5K + 图像和 1.5k + 正文蒙版。

* 如何利用数据集并构建自定义检测器

  • http://irvlab.cs.umn.edu/reso…

D)咸淡的水下鱼类辨认数据集

  • https://www.kaggle.com/aalbor…

* 指标:检测水下图像中的陆地物种。

* 应用程序:监督陆地物种

* 详细信息:89 个视频以检测鱼类,螃蟹,虾,水母,海星

* 如何利用数据集并应用 mmdet 构建自定义检测器——Faster-rcnn 管道

  • https://github.com/Tessellate…

文本剖析相干的数据集

A)文档布局检测数据集

  • https://www.primaresearch.org…

* 指标:检测文档布局以进行进一步剖析

* 利用:必不可少的将图像宰割成不同的局部,以便能够进一步利用基于规定的 NLP 和文本辨认的性能。

* 详细信息:5K + 图像,带有 10k + 批注的标签,如段落,图像,题目。

* 如何利用数据集并应用 mx-rcnn 构建自定义检测器

  • https://github.com/Tessellate…

* 在名为 IIIT-AR-13K 的文档中存在用于图形组件检测的十分类似的数据集,这是如何利用数据集并在其上训练模型的办法

  • https://github.com/Tessellate…

B)总文字数据集

  • https://github.com/cs-chan/To…

* 指标:在天然场景中定位文本

* 应用程序:应用 OCR 辨认的根本组件

* 详细信息:带有 5K + 多边形正文的 1.5K + 图像

* 如何利用数据集和应用 Text-Snake 管道构建自定义检测器

  • https://github.com/Tessellate…

C)YY-Mnist 简略 OCR 数据集

* 指标:在红色背景图像中定位数字并将其分类

* 应用程序:应用 OCR 辨认的根本组件

* 详细信息:超过 10 类的具备 2K + 批注的 1K 图像

* 如何利用数据集并应用 Retinanet 管道构建自定义检测器

  • https://github.com/Tessellate…

其余数据集

A)TACO 垃圾检测数据集

  • http://tacodataset.org/

* 指标–定位和宰割图像中的各种垃圾

* 应用程序:试图解决公共场所垃圾问题的主动机器人的要害组件

* 详细信息:蕴含 20 种以上不同类别垃圾对象的 15K + 正文的 10K 图像

* 如何利用数据集并应用 Retinanet 管道构建自定义检测器

  • https://github.com/Tessellate…

B)室内场景通用物体检测数据集

  • https://storage.googleapis.co…

* 指标:定位和检测图像中的室内对象

* 应用程序:在带有便当设施的房地产和租赁网站中为图像主动标记

* 详细信息:超过 10 种不同类别的室内对象(例如电器,床,窗帘,椅子等 )

* 如何利用数据集和应用 Retinanet 管道构建自定义检测器

  • https://github.com/Tessellate…

C)EgoHands 手部宰割数据集

  • http://vision.soic.indiana.ed…

* 指标:在天然场景中宰割手

* 利用:了解手势的第一步,以及在人机交互,手语辨认中的利用

* 详细信息:4.8K + 图像和相应的手罩。

* 如何利用数据集和应用 Retinanet 管道构建自定义检测器

  • https://github.com/Tessellate…

D)UCF 动作辨认数据集

  • https://www.crcv.ucf.edu/data…

* 指标:依据视频中执行的操作对视频进行分类

* 利用:标记视频对于存储和检索大量视频很重要

* 详细信息:对应于 101 种动作类别的 1K + 视频。

* 如何利用数据集和应用 mmaction-tsn50 管道构建自定义分类器

  • https://github.com/Tessellate…

E)油罐数据集

  • https://www.kaggle.com/toward…

* 指标:在卫星图像中检测油罐

* 利用:跟踪油罐

* 详细信息:具备 10K + 正文的 10K + 图像。

* 如何利用数据集并应用 Retinanet 管道构建自定义分类器

  • https://github.com/Tessellate…

其余动作辨认数据集

A)楼梯动作辨认数据集以及如何在其上训练模型

  • 数据集:https://actions.stair.center/…
  • 训练模型:https://github.com/Tessellate…

B)A2D 动作辨认数据集以及如何在其上训练模型

  • 数据集:http://web.eecs.umich.edu/~jj…
  • 训练模型:https://github.com/Tessellate…

C)KTH 动作辨认数据集以及如何在其上训练模型

  • 数据集:https://www.csc.kth.se/cvap/a…
  • 训练模型:https://github.com/Tessellate…

附录

无关教程的更多详细信息,请拜访咱们的 Github 页面

  • https://github.com/Tessellate…

原文链接:https://medium.com/towards-ar…

欢送关注磐创 AI 博客站:
http://panchuang.net/

sklearn 机器学习中文官网文档:
http://sklearn123.com/

欢送关注磐创博客资源汇总站:
http://docs.panchuang.net/

正文完
 0