关于算法:6-大经典机器学习数据集3w-用户票选得出建议收藏

内容一览：本期汇总了超神经下载排名泛滥的 6 个数据集，涵盖图像识别、机器翻译、遥感影像等畛域。这些数据集品质高、数据量大，经验人气认证值得珍藏码住。
关键词：数据集机器翻译机器视觉
本文首发自微信公众号:HyperAI 超神经

数据集是机器学习模型训练的根底，优质的公开数据集对于模型训练成果、研究成果牢靠度等具备重要意义。

HyperAI 超神经自上线以来，为数据迷信从业者提供了大量优质的公开数据集。本期内容分享，咱们筛选出了 6 个热门数据集，其总下载次数已达到 32,569 次。心愿这些数据集能进一步为宽广开发者服务~

注：本文梳理的数据集均来自网站：
https://hyper.ai/datasets

Tanks Temple 图像数据集提供高分辨率的视频，钻研人员能够从视频中采集图像，根据图像进行三维重建。该数据集包含训练数据和测试数据两类，其中测试数据分为中级组和高级组。

DOTA 全称为 A Large-scale Dataset for Object DeTection in Aerial Images，是一个蕴含 2,806 张航拍图的图像数据集，被用于在航拍图像中进行指标检测，发现和评估图像中的物体。

这些图像起源蕴含不同传感器和平台。每张图像的像素尺寸在 800800 到 40004000 的范畴内，其中蕴含不同尺度、方向和形态的物体。

往期推送请拜访：
DOTA 数据集：2806 张遥感图像，近 19 万个标注实例

VGG-Face2 是一个人脸图像数据集，蕴含共计 9131 集体的面部数据，图像均来自 Google 的图片搜寻。数据集中的人在姿态、年龄、种族和职业方面有很大差别。该数据集由牛津大学的工程科学系视觉几何组于 2015 年公布，相干论文有《Deep Face Recognition》。

UCAS-AOD 是一个遥感影像数据集，用于飞机和车辆检测。该数据集由国科大于 2014 年首次公布，并于 2015 年补充，相干论文有《Orientation Robust Object Detection in Aerial Images Using Deep Convolutional Neural Network》

OpenMantra 是一个针对日文漫画的机器翻译评估数据集，蕴含五种不同格调（fantacy、romance、battle、mystery、slice of life）的漫画。数据集中共蕴含 1593 个句子，848 个场景画面和 214 页漫画，由东京大学 Mantra 团队公布。

往期推送请查看：
漫画翻译、嵌字 AI，东京大学论文被 AAAI’21 收录

ImageNet 是目前世界上最大的图像识别数据库，由斯坦福大学传授李飞飞等人创立。次要用于机器视觉畛域的图像分类和指标检测。

数据集依据 WordNet 层次结构组织，其中每个节点（也称为类别）由数百甚至数千张图像组成。该数据集共蕴含 2.2 万个图像类别，约 1500 万张图片。

往期推送请拜访：
当年这个决定，让李飞飞奠定 AI 江湖的女王位置

以上就是本期举荐的 6 个 hyper.ai 高频下载数据集，更多数据迷信优质公开数据集，可点击文末浏览原文，或拜访以下链接下载：

[https://hyper.ai/datasets
](https://hyper.ai/datasets)

—— 完 ——