编辑切换为居中增加图片正文,不超过 140 字(可选)AI 数据产业飞腾倒退近日,昇腾 AI 开发者创享流动在杭州胜利举办并圆满闭幕,本次流动由杭州市高新区(滨江)党委人才办领导、杭州人工智能计算中心、华为技术有限公司主办,次要依靠杭州昇腾 AI 产业,汇集杭州具备硬实力的科技团队,进行深度技术交换和前沿科技分享,并进一步辐射全国开发者。
整数智能很荣幸作为流动受邀成员,以主动驾驶为切口,围绕 AI 数据与参会人员进行了深度的技术交换,展现了整数智能对 AI 数据行业的认知与奉献,也更加清晰地向咱们揭示了昇腾 AI 和整数智能协同单干、互利共赢的紧密联系。
昇腾 AI 开发者创享流动
昇腾 AI:公共算力的提供者
2021 年,美国将人工智能列为保护其超级大国位置的五大关键技术之一,全国次要国家和地区也都将人工智能作为重大策略布局,力求在新一轮国内科技竞争中把握主导权,中国更是将人工智能等前沿畛域作为强化国家策略的重要科技力量。
然而,随着人工智能的深刻利用,算力建设难以集中,中小企业或科研单位在简单模型、海量数据钻研上的问题愈发浮现。因而,建设大规模的人工智能计算中心,提供更加普惠的公共算力,成为推动人工智能产业衰弱疾速倒退的重要因素。
从去年开始,昇腾在不同城市的人工智能计算中心的建设过程中继续发力,力求通过算力网络买通从算力根底到利用生态的闭环,实现 AI 基础设施的技术创新,并在长期过程中扭转着 AI 的倒退模式,继续拓展 AI 的获取模式。
那么咱们都晓得,模型的规模越大,成果就越好,重剑无锋,大巧不公,而近几年硬件的洽购老本增长趋势是比拟迅猛的,将来可能会有更大的涨幅,所以算力对行业的影响是十分大的。
所以简略说硬件有多重要呢?怎么解决精度问题?用算力趟过来!怎么解决响应工夫问题?用算力趟过来!怎么解决泛化问题?用算力趟过来!所以当初大家对算力的要求都很高,算力的老本与大小在很大水平上决定了一个产品的好坏。因而整数智能在做了大量的调研和思考后决定,应用昇腾平台,雷同模型与其余超算平台相比,能节约 48% 的费用,同时在精度和服务能力方面也给咱们很大惊喜。
整数智能会议分享
整数智能:基于昇腾 AI 的算力利用
优质的数据 + 正当的模型 = 更好的 AI,数据在很大水平上决定了产品的好坏,如何高效地生产优质数据和高质量地利用数据是很大的一个课题。整数智能刘明皓以主动驾驶行业的数据标注为例,分享整数智能基于昇腾 AI 的数据闭环平台的开发,讲述主动驾驶的数据需要关系。
基于对数据的器重水平,整数智能在不断完善中迭代出了更加高效的数据标注工具,还在局部场景的标注工具中融入了 AI 算法,让机器与标注人员可能写作实现数据标注,大幅晋升数据生产效率。
例如整数智能服务的大量车企和主动驾驶算法公司,主动驾驶感知技术是主动驾驶的核心技术之一,训练主动驾驶感知模型须要应用大量数据。无关机构曾预计,L4 级别的主动驾驶须要数亿公里以上的数据,如此天量的数据,在传统生产方式下须要消耗巨量的老本和工夫,而主动驾驶场景,存在着大量的 corner case,如果得不到解决,将会间接影响到主动驾驶的安全性,所以这时就须要一套体系去筛选 corner case,帮忙模型更好地迭代。
提及数据标注工具,大家可能会想到 labelme 或者 labellmg 这样的开源软件,开源的标注软件足够满足数据标注 1.0 时代的数据处理需要 (1 万量级的工作量)。随着神经网络的加深,AI 模型须要更多的数据(10 万量级的工作量) 来晋升模型训练成果,数据标注也就进入了 2.0 时代,本来的单机标注工具不再能满足这个时代的数据处理需要,因而数据标注平台应运而生。
通过流程化的平台操作实现了数据生产环节的协同合作,而对多供应链接入的反对也使得数据产能能够实现弹性扩容。随着 Al 在垂直行业的深刻落地,诸如智能驾驶畛域,数据处理量级则更为宏大,往往在 10 万甚至 100 万量级以上,数据标注 3.0 时代也逐步拉开帷幕,这一时代的数据是海量的,同时数据准确度的要求也更高,仅仅依赖人工进行标注、审核,很难再满足这一时代的需要,因而基于 AI 辅助零碎的人机协同数据生产平台则成为了这个时代的刚需。
整数智能 3D 点云标注界面
AIPower 模块:助力算法模型迭代
为了更好地晋升数据标注服务,整数智能搭建了一个 AI 辅助零碎的人机协同数据生产平台,利用 AIPower 模块,提供包含 AI 预标注、AI 审核在内的 Al 辅助性能。
AI 预标注: 是指在标注开始前,由算法零碎实现对一整批数据的算法推理过程,失去一整批数据的预标注后果:AI 协同标注: 在标注进行中,标注人员实现大量标注,而后由算法实现对这一条数据的其余标注工作;AI 审核: 在标注实现后,由算法实现对一整批数据的算法推理过程,并将理论标注后果与算法审核后果进行比对,并反馈出存在较大可能性有谬误的数据,供审核人员重点审核。
AlPower 模块,还能够反对用新失去的数据集成品实现算法模型迭代,从而在下一批数据生产过程中,提供更准确的 AI 预标注、AI 协同标注以及 AI 审核能力,咱们平台为了易用性做了很多的取舍,因为咱们的受众不只是业余的算法工程师,也包含项目经理及相干从业人员,所以怎么解决易用性问题?用算力趟过来! 咱们只须要调整很少的超参,因为咱们应用了 NAS+AutoML,为什么咱们能用这么侈靡的计划?因为昇腾的算力的确能为咱们节约更多老本,物有所值,所以心愿将来能产生更深度的单干,互利共赢。
本次杭州站昇腾 AI 开发者创享流动的胜利举办,通过打造一系列围绕昇腾 AI 根底软硬件平台的开发者生态流动,稳步推动产教交融育人向前倒退,无效助力杭州打造人工智能产业链标杆。而整数智能作为人工智能产业技术联盟的一员,将会在技术深耕路线上持续砥砺前行,为 AI 数据奉献本人的独特力量。
整数智能好奇心专栏
除了便当的数据标注平台,整数智能还自研 AI 辅助工具以进步数据生产效率,包含光流跟踪算法、OCR 预标注零碎、ASR 辅助音频采集等,能节俭大量的人力标注工夫与复核老本。
另外,整数智能标注平台能够通过多终端无缝连贯,全场景满足用户需要,可对品质进行灵便抽查、动静分阶段验收,帮忙 AI 企业随时把控数据标注品质及进度,保障信息的同步性,让数据真正牢靠可控。不仅如此,为进步数据集的交付品质,整数智能对数据生产全过程实现了全方位的品质把控。在人员治理方面,波及到数据生命周期的各级人员都参加到品质治理中,确保经手数据的每一方都能严控品质。
正因为继续的技术能力和行业积淀,让整数智能成为了人工智能产业联盟的产业数据组专家,独特参加制订 AI 行业的数据规范和白皮书工作,失去中国电子技术标准化研究院和信通院的邀请参编 SC42《可信赖人工智能标准化白皮书》与《人工智能研发经营一体化(Model/MLOps)能力成熟度模型》规范体系。参加制订包含过程治理、模型治理、平安与风险管理、组织构造、零碎与工具等 5 个能力规范,致力于帮忙企业进步 AI 研发经营治理能力,晋升 AI 模型治理能力,为 AI 大规模利用提供无效门路。参加制订的 TC260《AI 数据采集及标注平安标准》,聚焦 AI 数据采集及标注过程及过程中可能呈现的安全隐患,提炼、梳理相干平安技术。