关于人工智能:数据标注是一块肥肉盯上这块肉的不止中国丨曼孚科技

5次阅读

共计 1826 个字符,预计需要花费 5 分钟才能阅读完成。

“我感觉数据标注始终被世人误会,数据标注不是人工智能界的‘富士康’。”

数据标注到底是怎么的工作?作为人工智能服务行业的一员,为什么被扣上“劳动密集型”的帽子?

推本溯源,这还要从 7 年前说起。

2015 年百度 AlphaGo 的横空出世,像丢进水里的炸弹一样,掀起 AI 界的风平浪静。

尔后的日子,人工智能行业在聚光灯下飞奔,跑出实验室、实现”AI+ 产业“落地,成为新基建的重要一员。AI 行业也经验了资本的冰与火,逐步走向感性。

但作为 AI 产业链的最上游,数据标注行业却始终游离在聚光灯外,被人用有色眼镜对待。

就连大佬刘慈欣都婉言:“当初的人工智能,后面有多少智能前面就有多少人工。”

人们为数据标注带上“流水线、小作坊、贫困县”等等标签,它就像小丑一样,更多被用来调侃人们对 AI 的冀望与差距。

但任何合乎倒退法则的事物都会随着时代提高,难道数据标注是例外吗?

数据标注的真面目

最开始,嗅到商机确实是一批小团体,简直与 AI 守业潮同时起步。

刚衰亡的 AI 大多处于试验阶段,对数据需求量少、要求较低,这吸引了大量以劳动密集为主的作坊,这些“小作坊”以外包 (BPO) 业务为主,给外界留下了“富士康”的印象。

而随着 AI 大规模落地,对数据需要更加深广,行业开始跨过横蛮成长,进入精耕细作,数据标注也迎来了严苛考验。

面对标注场景更细分、数据类型更简单、定制化需要更繁琐的甲方,整个 AI 根底数据服务产业被迫经验了转型降级——更多劳动密集型企业正面临生死关头,更多的技术型公司正在突出重围。

这个行业曾经走过了小作坊的粗放期间,开始走进“技术致胜”的时代。

难以呈现的独角兽

其实不难发现,数据标注是一块肥肉,盯上这块肉的也不止中国。

国外早已成长起数家 AI 数据服务行业的巨头,像 Scale AI、Appen、Lablebox 等。

但放眼国内,不仅没有独角兽,连大型的数据标注公司也少之又少。这不禁让人纳闷,为什么差距会这么大?

次要问题还是投资人对数据标注的认识,掂量企业投资价值会根据业务类型、成长空间、技术价值等参考因素。显然,数据标注不被看好。

国内大部分投资者将标注技术公司等同于标注业务公司,加之局部媒体对行业劳动密集属性的刻画,使得晋升行业效率的技术价值没有被公道认可,企业天然难以融到大量金额。

而国外比拟认可标注公司的技术价值,因而融资金额多,许多公司仅靠融资就能火起来。

据不齐全统计,北美数据标注公司与国内相干公司的估值至多相差 10 倍,融资金额少则几千万多则上亿美金,而国内融资广泛在千万人民币。

不过,随着投资者对行业意识的深刻,这种差距会逐步缩小。

重技术的转型之路

据中金企信统计数据显示:2019 年中国根底数据服务行业的市场规模已达 30.9 亿元,预计 2025 年将冲破 100 亿元,复合年增长率达到 21.8%。

面对逐步正规化的行业需要,越来越多中小型供应商苦恼生存问题,这一群体在 1 - 2 年内就会迎来“开张潮”。

而最初留存下来的公司,依附的将是 AI+ 私有化部署 + 平台的模式。以后,将技术引入数据标注流程已是业内通用做法,让训练好的 AI 模型反哺人工标注,也是标注技术公司的劣势所在。

以曼孚科技为例,曼孚科技作为行业当先的 AI 基础架构与数据智能平台服务商,专一为 AI 企业提供从策略到技术落地的一站式数据解决方案。

作为新一代技术导向型公司,曼孚科技自研智能数据服务平台 SEED,该平台作为数据智能平台体系的重要组成部分,是实现重构 AI 基础架构的要害。

SEED 平台除领有目前市面上支流第二代平台的“多场景标注能力 + 无限项目管理能力”以外,还创新性的大量引入生命周期治理、AI 加强等模块,造成了笼罩“数据全生命周期治理能力 + 供应链治理 + 我的项目协同 +AI 人机协同 + 自定义权限 + 全场景标注”的多维平面数据处理能力。

在这些功能模块的加持下,平台数据标注效率均匀晋升 10 倍以上;AI 辅助筛查下,数据精准度可达 99.99% 级别,直击 AI 企业数据需要痛点,从源头端解决 AI 利用场景继续拓展对于多源异构数据的海量需要。

结语

近期总有数据标注员苦恼职业规划问题,醉生梦死传授常识的 AI,却终会代替人类,落得个本人革本人的命的下场。

诚然,机器会越来越智能,这是失常倒退法则,也是人类的冀望。不过,在一些全新的畛域,机器尚不能辅助人类工作,数据标注仍需人力实现。即使有了 AI 自动化标注工具,仍然要由人来做审核质检的最初一步。

就算这一天真的到来,被喻为 AI 老师的数据标注员也会是 AI 淘汰的最初一类人,因为总有工作须要人来实现。

正文完
 0