乐趣区

关于数据分析:曼孚科技丨为什么印度是数据标注服务的热点

人工智能行业有句话:有多少智能,背地就有多少人工。随着大数据、云计算和人工智能等技术飞速发展,数据标注服务逐步走入人们视线,成为新形势下商业价值凸显的重要抓手。

数据标注就是机器学习的过程,数据标注员应用自动化的工具从互联网上抓取、收集数据包含文本、图片、语音等等,并对抓取的数据进行整顿与标注,他们的工作是教会 AI 意识数据,根据这些大量而无效的数据总结法则,教诲 AI 像人一样去感知、思考和决策,最终造成本人的工作模式,更好地为人类服务。

行业背景

一个算法通过越多数据的训练,它的精确度就越高,换言之,AI 行业将始终须要更多精确注解与标注的数据。现在寰球巨头企业纷纷倒退人工智能,2020 年寰球数据标注工具市场已达 4940 亿美元,预计 2021 年至 2028 年将以 27.1% 的复合年增长率 (CAGR) 增长。其疾速更迭的次要能源来自于图像数据标注的日益遍及,依据标注类型,市场上次要分为手动、半监督和主动三种,其中手动数据标注最受欢迎,因为它具备准确性、完整性及关联性劣势,能够更好的集成至算法中,为汽车、批发、医疗保健与金融等畛域提供数据反对。

印度市场

标记训练数据集是一项简单、耗时且须要大量劳力的繁琐工作,印度作为世界排名第二的人口大国,为数据标注提供了一个宏大的人才库,该国科技行业的外包热潮使其成为这种精细工作倒退的温床。印度软件与服务业企业协会 (Nasscom) 高级副总裁兼首席策略官 Sangeeta Gupta 示意:“在印度,这算是一个新兴的行业……大家慢慢意识到这一行业行将开启的微小时机。人工智能须要借助于被正确注解、分类和进行匿名解决的数据。在这件事上,无论人们观点如何,除了自动化伎俩以外,娴熟的工人同样必不可少,这便是印度的时机。”

转型之路

Open Text 产品营销高级总监 Lori Mc Kellar 认为:“在这个日益数字化的世界中,印度的人员和技能将成为多年的要害资源。”在经验世纪之交业务流程外包的热潮之后,越来越多用来训练人工智能的数据集被打上了“企业专有权”的标签,印度人对这些企业的需要和所用术语并不生疏。和业务流程外包相似,数据标重视在对工作流程的治理,其所需技能即便是高中学历的人也能够通过训练把握,这种低薪 + 低技能的工作,使领有同等条件的罗马尼亚、印度尼西亚、越南、菲律宾等其余倒退中经济体也将有机会跟进并退出这一畛域。

因而想在标注市场放弃领先地位,企业和数据标注团队在需要、品质管制、反馈和成绩交付方面的互动应更加严密,正如 Cranberry 首席执行官兼创始人 Shishir Thakur 所言:“只有通过为高复杂性和中高水平技术能力的人工智能服务才是咱们不被取代的前途。”

退出移动版