过来的 2021 年,对于数据标注行业而言,是略显“矛盾”的一年。
一方面以主动驾驶场景为外围的数据处理需要继续激增,数据标注行业迎来倒退的瘠田; 另一方面,行业融资事件寥寥,且仍然没有诞生独角兽企业。
与前十年横蛮增长不同,迈入下半场的数据标注行业急需的不仅是思考,更是扭转。
主动驾驶进入商业化经营阶段
2021 年,国内主动驾驶行业迎来新一轮倒退顶峰。
相干统计数据显示,过来一年国内主动驾驶行业披露的融资事件高达 94 起,融资总金额超 435 亿,同比历史最高。与之绝对应,美国加州交通管理局 DMV 公布的 2021 年主动驾驶 MPI 数据中,中国企业占据榜单半数,其中,Auto X 位列第一,滴滴位列第三,国内主动驾驶企业竞争力凸显。
主动驾驶行业的昌盛一方面与产业链一直降级相干,另一方面也离不开国家政策的鼎力疏导。
产业链方面,摄像头、毫米波雷达、超声波雷达、激光雷达等硬件老本一直降落,主动驾驶感知零碎愈发欠缺。以激光雷达为例,与前几年动辄上万美元的天价相比,目前支流激光雷达厂商的产品价格已大幅升高。
例如 Luminar 推出了 1000 美元的 LiDAR 解决方案,Velodyne 公司则打算在将来几年将均匀售价从 17900 美元降至 600 美元,而华为则发表会将量产的激光雷达单价管制在 200 美元以内,这为主动驾驶汽车的大规模量产打下了松软的根底。
政策方面,国家和中央政府先后出台多项政策性、规范性文件,激励主动驾驶行业衰弱有序倒退。
主动驾驶分级规范方面,工业和信息化部率先推出国家级规范《汽车驾驶自动化分级》,对主动驾驶技术等级及其划分因素做出规定。在路线测试和市场准入方面,国家多部委也先后推出《智能网联汽车路线测试治理标准》、《道路交通安全法 (订正建议稿)》、《智能网联汽车生产企业及产品准入治理指南 (试行)》等多项重磅性产业政策。
在以上这些政策、法律标准的铺垫下,主动驾驶行业向商业化经营阶段迈出关键性一步:北京智能网联汽车政策后行区,在 2021 年向局部企业颁发国内首批主动驾驶车辆免费通知书,这让北京成为国内首个明确认可“Robotaxi”商业化试点的城市,同时也标记着国内主动驾驶赛道终于迎来商业化经营阶段。
数据标注行业的下半场
主动驾驶行业的凋敝也带动了上下游产业链的昌盛,尤其以数据标注行业为代表。
L3 级别以上的主动驾驶零碎次要由感知、定位、预测、决策和管制五局部形成,每局部均不可或缺。其对于计算机视觉技术的需要依赖度较高,零碎须要对传感器采集的点云图像数据进行实时处理,构建车辆行驶环境,为预测和决策做根据,这对算法的准确性和实时性考验极大。
目前主动驾驶视觉技术次要以有监督深度学习形式为主,是基于已知变量和因变量推导函数关系的算法模型,须要大量标注数据对模型进行训练与调优。
换言之,想要让主动驾驶汽车更“智能”、主动驾驶算法能更加从容应对复杂多变的路线环境,背地就须要有海量且高质量的实在路线数据做撑持。相干统计数据显示,目前国内根底数据服务市场需求在 200-500 亿元规模,且放弃每年 30%-50% 以上的高速增长。
然而,与疾速扩张的市场需求相比,则是行业落后的生产力,集中体现在数据服务商产能无奈满足市场需求以及数据产出品质较低两方面。
产能方面,目前国内数据标注第一梯队服务商年营业额广泛以千万级为主,业务规模、执行效率与项目经理能力高度绑定,产能瓶颈问题凸显,无奈无效填补并抢占极速扩张的需要市场。数据标注产业在国内倒退多年,却从未诞生独角兽企业。
数据产出品质方面,随着主动驾驶行业迈向商业化经营阶段,以点云数据为代表的数据处理需要占比逐步扩充,传统依附简略工具且依赖人力的业务执行形式,曾经愈发无奈满足垂直市场的需要。
站在产业倒退的角度,数据标注行业的下半场,外部急需酝酿一场深度改革。
PLG 模式下的增长飞轮
深度分析数据标注行业存在的各类问题,会发现无论是产能扩张受限还是数据产出品质较低,都能够用一个更简练的起因概括:轻技术而重人力。
长期以来国内数据标注行业始终处于粗放状态中,行业门槛低,拉起一批人,经简略培训,依附性能简陋的工具即可满足大部分标注我的项目需要,前期业务拓展则齐全依赖销售驱动增长 (SLG)。
这种模式在初期的确能够提供规模可观的业务量增长,但也很容易陷入扩张的瓶颈期,短期线性业务增长无奈维系企业长期倒退,过于依赖项目经理以及标注员的执行形式也会因人员流动而产生较大的波动性。
因而,数据标注行业的改革也将是一场业务模式的改革,而 PLG 模式无望成为解决行业困局的一剂良药。
PLG 模式的英文全称是“Product Led Growth”,即产品驱动增长。这个概念最早由风投公司 OpenView 提出,该业务模式的外围依赖于产品本身作为获取、转化、扩大客户的能源。
2018 年 SaaS IPO 公司的剖析中,Openvie 发现:PLG 公司比其余非 PLG 同行体现更好,且估值高出 30%。依据 Bessemer Venture Partners (BVP) 统计,在美国 To B 市场,PLG 正成为一种支流的成长模式,这类公司在 2020 年的总市值靠近 6000 亿美元。
相较于传统 SLG(销售驱动增长) 模式重销售轻体验,PLG 模式更加重视产品本身,即产品力建设。数据标注行业以往“轻技术而重人力”的业务逻辑形式,已被市场证实存在业务增长受限、产品力无奈满足甲方需要等问题,产能天花板更是成为困扰一众数据服务商的“顽疾”。
而 PLG 以产品力为外围的新模式,则赋予了数据服务企业以更低人力收入和边际老本,提供更具标准化解决方案的能力,高水准的数据智能平台更成为企业解脱人力依赖,冲破业务增长天花板,从线性增长到指数型增长的要害。
以曼孚科技 SEED 数据服务平台为例,作为曼孚科技第三代数据智能平台产品,SEED 平台除领有目前市面上支流第二代平台的“多场景标注能力 + 无限项目管理能力”以外,还创新性的大量引入生命周期治理、AI 加强等模块,造成了笼罩“数据全生命周期治理能力 + 供应链治理 + 我的项目协同 +AI 人机协同 + 自定义权限 + 全场景标注”的多维平面数据处理能力。
在这些功能模块的加持下,平台数据标注效率均匀晋升 10 倍以上;AI 辅助筛查下,数据精准度可达 99.99% 级别,直击 AI 企业数据需要痛点,从源头端解决 AI 利用场景继续拓展对于多源异构数据的海量需要。
从短期角度来看,PLG 模式对企业而言意味着高投入与放弃短期增长,但从久远角度考量,以产品力为外围将更具竞争力,更是一种高效的增长模式。
数据标注行业的下半场,PLG 模式无望为数据服务企业构筑起一条产品技术造就的护城河,成为驱动企业业务增长的飞轮。