共计 1145 个字符,预计需要花费 3 分钟才能阅读完成。
本文旨在从主动驾驶角度分析数据标注工作内容,帮忙读者对主动驾驶标注有更清晰的认知。
深耕数据标注行业多年的搭档可能都晓得,仅依附主动驾驶的相干我的项目,就能撑起数据标注半边天。作为人工智能的“时代宠儿”,主动驾驶因关乎生命安全的非凡性质,技术容错率趋近于零。因而除数量外,主动驾驶对数据品质也有极高要求。
数据标注在哪一环节
现阶段,主动驾驶需解决四方面问题:看得见(定位、避障)、听得着(决策、管制、执行)、讲得出(门路布局、前进形式)、会思考(边缘计算),即感知、决策与执行。
传感器 (雷达、摄像头) 实时收集汽车四周的信息、数据被传输至主动驾驶计算平台进行剖析和解决、主动驾驶零碎做出决策并执行——这便是整个主动驾驶零碎工作流程。其中,数据标注就像一道桥梁,它的作用是解决传感器采集到的非结构化数据,将其转换成机器可了解的语言,以供计算机平台剖析解决。
数据标注要做什么
上文提到,数据标注的工作是对非结构化数据进行解决以供机器学习,具体来说,标注员通过对图片、视频、文本数据,进行拉框、标点等操作,以产出满足算法训练的数据集。
主动驾驶波及的数据集中于图像与 3D 标注,图像标注办法蕴含矩形框、语义宰割、多边形、多段线、关键点、平面框、椭圆,3D 标注办法蕴含间断帧、2D3D 交融与语义宰割。
标注员在工作之前需查看对应的需要文档,以理解此次工作具体细则。总结下来,主动驾驶常见的标注物体蕴含:
丨路线可行驶区域(汽车可行驶区域)
丨栏杆 / 隔离栏 / 石墩丨杆状物(牌杆、路灯杆、交通灯杆)
丨路边修建 (路线两侧建筑物) 丨绿化植被(路线两侧或隔离地带的绿化带、草地、树木)
丨汽车(小、中、大型车辆)
丨非机动车(自行车、摩托车、三轮车)
丨行人 (步行的人) 丨车道线(红色、单黄、虚实线)
丨人行道(宰割标注)
丨红绿灯(交通灯局部)
数据标注工作模式
数据标注次要分为人工、主动与半自动标注,现阶段,人与机器联合的半自动标注是国内当先数据标注公司的支流形式,如曼孚科技 MindFlow SEED 平台的吸附画布与编辑点性能便是 AI 辅助的体现。
除标注外,质检也可通过 AI 辅助实现。家喻户晓,一套残缺的数据标注对接流程包含需要承接、标注筹备、正式标注、验收交付、模型训练与上线经营。
而通过 AI 辅助标注与质检不仅可能缩短交付周期且能进步标注准确率,这也是主动驾驶企业偏向与技术型数据标注公司单干的起因。
以曼孚科技为例,曼孚科技深耕主动驾驶赛道多年,专一于为主动驾驶企业提供定制化数据解决方案,次要客户波及主机厂、新权势、Tier1、算法芯片、高精地图等,截至目前已为数百家主动驾驶企业提供业余数据服务。
而在将来,曼孚科技将表演行业的“先行者”角色,为产品矩阵退出更多引擎,帮忙汽车企业实现自动化转型,用优质数据服务放慢主动驾驶落地步调。