共计 4055 个字符,预计需要花费 11 分钟才能阅读完成。
在人工智能主动驾驶畛域中,精确的环境感知和准确的定位是主动驾驶汽车在简单动静环境中可能进行牢靠导航,信息决策以及平安驾驶的要害。尽管古代相机能够捕捉到十分具体的真实世界特色,然而能够提供给主动驾驶汽车神经网络的信息无限。与此同时,相机在应用过程中存在诸多限度,例如在天气情况不佳时,雨水或雾气升高了能见度,使相机能捕捉到的信息密度和品质大打折扣;又比方在光线有余的夜晚或隧道内,相机接管到的光线无限,影响了路线信息的捕获。
正因相机的这些毛病,通过激光雷达来加强感知能力的形式失去了关注。激光雷达最后被装置在飞机上用于扫描飞机飞过的地形,它发射的光脉冲以光速流传,光脉冲打到物体外表反射后被激光雷达接管,通过记录光脉冲射到指标的工夫从而测出间隔等测量值,这些测量值被聚合成点云,它实质上是一组坐标,代表零碎曾经感应到的物体。
通过几代技术的迭代,3D 点云采集技术的倒退,现在激光雷达的采集性能失去了极大的进步,3D 点云数据能够提供比以前更粗疏的信息,并且它的价格越来越实惠。与此同时,越来越多的公开点云数据集的公布进一步推动了深度学习在 3D 点云上的钻研,深度学习技术的倒退使其解决 3D 点云数据的成果越来越好。近年来,主动驾驶畛域对激光雷达感知技术的要求越来越高,因而对 3D 点云数据的标注需要天然也随之扩充。
3D 点云标注开源工具举荐
Semantic Segmentation Editor
【简介】
- 该工具是一个应用 React、Paper.js 和 three.js 开发的 Meteor 应用程序,是用于创立 AI 训练数据集(2D 和 3D)的基于 Web 的标注工具。它是在主动驾驶钻研的背景下开发,反对对 2D 图像数据(.jpg 或.png)和 3D 点云数据(.pcd)进行语义宰割标注
- 该工具的 PCD(Point Cloud Data)反对以 ASCII、二进制和二进制压缩格局输出,反对的输出字段有 x、y、z、label(可选)、RGB(可选),输入的 PCD 格局为 ASCII,字段为 x、y、z、label、object 和 RGB
【GitHub 地址】
- https://github.com/Hitachi-Au…
【装置要求】
- OSX / Linux / Windows
- 需装置 Meteor
【亮点 / 劣势】
- 2D 语义宰割:有多种工具可用于创立标注多边形,蕴含了多边形绘图工具、魔法工具(应用对比度阈值检测主动创立多边形)、操作工具、切割 / 扩张工具、间断多边形工具
- 3D 语义宰割:间隔衰减性能可使点云随间隔减少而放大大小,工作中可调整点云大小使指标点云散布更清晰,可先宰割出留神区域再在留神区域中进行语义宰割,实现语义宰割后可一键生成指标物体的 Bounding Box
【有余】
- 2D 与 3D 相互拆散,不能做到 2 /3D 交融标注
该平台通过绘制宰割区域来进行语义宰割,这样的形式容易选中非指标区域的点云,此时就须要对其进行修改
Point Cloud Annotation Tool
【简介】
- 用户为每个指标类别提供了一个种子,随后为网络预测的宰割提供修改笔画。与手工办法相比,该工具可能以更少的点击次数实现目标标注。工具应用了 PointNet 网络在 ShapeNet 数据集上训练,ShapeNet 数据集中的次要类别是室内物体,所以当工具用来标注主动驾驶场景时,其主动标注的成果会差一些。然而该工具通过点击的形式进行语义宰割,对于工具的开发是一个很好的启发
【GitHub 地址】
- https://github.com/siddhantja…
【装置要求】
- Windows
- 创立虚拟环境并在其上装置 Tensorflow
- 装置 PCL 和 OpenCV
【亮点 / 劣势】
- 仅以点击的形式就能实现目标物体的语义宰割
- 工具中的神经网络算法可能依据用户的点击地位剖析出左近的点云是否属于同一类标签
【有余】
- 没有残缺的 UI 界面,很多操作通过命令行来进行
- 无奈间接使用到主动驾驶场景
SAnE
【简介】
- SAnE 是一款基于 Latte 的对用户更加敌对的标注工具。与 Latte 相比,SAnE 能够取得一个更具备竞争力的后果,均匀 IoU 为 84.27%,召回率为 86.42%。而在众包环境下进行测试时,SAnE 的 IoU 和召回率别离为 79.36% 和 80.64%
【GitHub 地址】
- https://github.com/hasanari/sane
【装置要求】
- 装置虚拟环境及依赖项,依赖项在 github 地址 requirements.txt 文件中
- 下载预训练的去噪权重
- (可选)下载基于 PointCNN 的智能模块
【亮点 / 劣势】
- 去噪点式宰割,这是一种新鲜的简直无噪音的语义宰割策略,可能实现弱小的一键式标注技术
- 疏导式跟踪,基于一个静止模型,通过所有的帧提供基线跟踪,并应用启发式办法(贪心搜寻和回溯算法)进行改良。对于人类标注者来说,只须要最小的调整来追踪间断的点云场景
- 改良的标注流程,通过基于人工智能的性能(一键式标注、疏导式追踪和全自动边界框倡议)和基于用户界面(UI)的改良(如只用键盘正文、多用户环境、用户调整参数和三维边框预计)来增强标注
【有余】
- 性能繁多,只能进行指标检测标注工作
SUSTechPOINTS
【简介】
- SUSTechPOINTS 是一个全面的数据集正文平台零碎,该零碎在可视化模块、互动工具和正文传输方面提供了更多高级性能
【工具演示】
【GitHub 地址】
- https://github.com/naurril/SU…
【装置要求】
- 可通过 Docker、源码、uwsgi 装置我的项目
- 装置依赖项,依赖项在 github 地址 requirements.txt 文件中
- 需下载预训练模型 deep_annotation_inference.h5
【亮点 / 劣势】
- 主视图聚焦模式:在主视图中一键放大和聚焦选定的对象
- 聚焦背景:将以后对象的二维图像作为照片背景显示在一个繁多的子视图中
- 流播放:将间断的 3D 数据作为视频流播放
- 主动方框初始化:只需选取指标物体,就能主动将三维标注方框与整个三维对象数据贴合
- 可对标注指标进行批处理操作,晋升标注的效率
【有余】
- 工作性能繁多,只能进行指标检测工作,当我的项目有其它类型的标注工作需要时无奈应用该工具
整数智能的 AI 数据服务
为什么会诞生整数智能数据管理平台
提及数据标注工具,大家可能会想到 labelme 或者 labelImg 这样的开源软件,开源的标注软件足够满足数据标注 1.0 时代的数据处理需要(1 万量级的工作量)。
随着神经网络的加深,AI 模型须要更多的数据(10 万量级的工作量)来晋升模型训练成果,数据标注也就进入了 2.0 时代,本来的单机标注工具不再能满足这个时代的数据处理需要,因而数据标注平台应运而生,通过流程化的平台操作实现了数据生产环节的协同合作,而对众包模式的反对也使得数据产能能够实现弹性扩容。
随着 AI 在垂直行业的深刻落地,诸如智能驾驶畛域,数据处理量级则更为宏大,往往在 10 万甚至 100 万量级以上,数据标注 3.0 时代也逐步拉开帷幕,这一时代的数据是海量的,同时数据准确度的要求也更高,仅仅依赖人工进行标注、审核,很难再满足这一时代的需要,因而基于 AI 辅助零碎的人机协同数据生产平台则成为了这个时代的刚需。
在长期为 AI 畛域的企业以及科研机构提供高质量的数据服务的过程中,咱们整数智能联合多年的数据项目管理教训,将一系列最佳实际融入平台的治理模块,为数据我的项目管理者提供一套现成的、被验证过千余次的数据生产治理流程。同时,咱们迭代出了更加高效的数据标注工具,为了谋求极致的标注效率,咱们还在局部场景的标注工具中融入了 AI 算法,让机器与标注人员可能合作实现数据标注,大幅晋升数据生产效率,满足了数据标注 3.0 时代对数据平台的需要。
对于整数智能
整数智能信息技术(杭州)有限责任公司,源自浙江大学翻新技术研究院,愿景是成为 AI 企业的数据合伙人。
目前为浙江省人工智能产业技术联盟(ZJ AIITA)、中国人工智能产业倒退联盟(AIIA)、上海市人工智能行业协会(SAIA)等出名 AI 产业协会成员。
整数智能致力于为人工智能畛域的企业以及科研机构,提供高质量的数据服务与一站式的算法研发平台,蕴含数据采集、数据标注、成品数据集、数据管理平台私有化部署等服务。目前公司已服务海内外顶级科技公司与科研机构 200 余家,领有知识产权数十项,屡次参加人工智能畛域的白皮书与规范撰写。我的项目已受《CCTV 财经频道》、《新锐杭商》、《浙江卫视》、《苏州卫视》等多家新闻媒体报道。
- 业余的团队和技术撑持
研发团队为来自浙江大学的博士团队,在人工智能畛域有多年的积淀
已申请受权多项知识产权,自研多个 AI 辅助提效工具,可能节俭 30% 以上的标注老本 - 满足全面标注需要
在图像数据方面,咱们反对多边形宰割、语义宰割、2D 框、线标注、点标注等多种图像数据标注
在视频数据方面,咱们反对视频审核、视频转录、视频宰割、跟踪标注在内的多种视频数据处理
在文本数据方面,咱们提供内容审核、情绪剖析、文本相关性、语义剖析在内的文本类型数据处理
在音频数据方面,咱们反对语音采集、语音宰割转录、语音审核等语音标注类型
在 3D 点云数据方面,咱们反对 3D 点云框标注、3D 点云语义宰割、3D 点云车道线标注、2/3D 交融数据标注等多种 3D 点云数据标注类型 - 欠缺的供给体系和管理系统
需要即时响应,自建的可弹性扩容的标注供应链体系笼罩 2 万人以上的标注人员,可能实现大规模的数据生产
平台日峰值能够满足 100 万张图像或 1000 小时音视频标注解决需要 - 丰盛的标注教训
服务范畴涵盖主动驾驶、安防、金融保险、智慧城市、智慧工厂、智能语音、安防等畛域
服务客户包含顶级的科技企业以及国内外顶级的 AI 科研机构
分割咱们
咱们心愿通过咱们在数据处理畛域的业余能力,在将来三年,可能赋能 1000+ 以上的 AI 企业,成为这些企业的「数据合伙人」,因而咱们十分期待能与正在浏览这篇文章的您,有进一步的沟通交流,所以十分欢迎您来分割咱们,一起摸索单干的可能性,咱们的联系方式如下:
邮箱:[email protected]
公众号:整数智能 AI 研究院