关于人工智能:百度联合清华全球首个十亿像素数据集来了

42次阅读

共计 992 个字符,预计需要花费 3 分钟才能阅读完成。

近日,百度智能云数据众包与清华大学发展我的项目单干,推动寰球首个十亿像素级视频数据集 PANDA 的建设工作,用以反对将来在公共安全、智慧城市、虚拟现实等畛域的各项钻研及利用。

本次我的项目共实现 7200 余帧亿级像素图片,共计超过 106 万张切图的数据标注工作,包含物体间关系近 2 万组、交互行为近 20 万个、挪动物体轨迹点近 30 万组,以及数十亿 3D 点云数据的语义宰割及实例标注,极大地丰盛了 PANDA 现有数据集,并为清华大学后续举办的 GigaVision(十亿像素级机器视觉)主题挑战赛提供数据反对。

清华大学 GigaVision 挑战赛
PANDA 数据集视频演示

近年来,行人检测、轨迹跟踪、动作辨认、异样检测、属性辨认等计算机视觉剖析,已宽泛使用到无人驾驶、智能安防、智慧城市等多个畛域。AI 算法利用的背地,离不开大批量、高质量的标注数据。百度数据众包作为国内最大的 AI 数据服务提供商,具备数据“采、标、存、管、训”一体化的服务能力,专一于为人工智能的倒退与利用赋能。

据理解,PANDA 是寰球首个十亿像素级视频数据平台,它冲破了人眼视觉分辨率的极限,赋予视觉计算更高质、更实在、更全面的源数据,填补了国内上“宽视场、多对象、高分辨率”数据平台的空白,为新一代智能解决技术钻研提供了不可或缺的数据根底。

支流图像及视频数据集比照

清华大学电子工程系副教授、PANDA 数据集我的项目负责人方璐介绍,此前清华大学团队曾围绕 PANDA 数据集,在计算机视觉顶级国内会议 ECCV 2020 上,组织了 GigaVision 2020 挑战赛并引起宽泛关注。目前,团队正在操办 ACMMM 2021 会议的 GigaVision 主题挑战赛,以及寰球人工智能技术创新大赛的相干赛道。

钻研事实世界中大规模人群的简单行为及交互方式,对于人工智能零碎更好地了解人的行为与用意,进而晋升智能决策能力有着重要意义。PANDA 数据平台的构建,使得对于大场景、多对象、简单关系的建模与剖析成为可能。将来,百度将继续与清华大学单干,以技术赋能,推动 PANDA 数据平台的建设与倒退。

百度作为国内人工智能领军企业,也是中国惟一在智能交互、智能基础设施和产业智能化畛域,都造成了劣势的 AI 平台型公司。依靠百度多年 AI 数据教训,百度数据众包专一以数据智能对外赋能,致力于提供优质数据服务,携手政府、企业、高校等更多合作伙伴,独特推动新一代人工智能的高质量倒退。

正文完
 0