案例 | 助力上汽安吉物流批量化迭代 AI 模型,让物流治理更智慧
近日,《2022 爱剖析·人工智能利用实际报告》选取了格物钛助力上汽安吉物流的案例作为企业智能化落地的当先实际。
面对客户在研发智能物流解决方案时非结构化数据集难治理、模型开发流程割裂而效率低下等痛点,格物钛数据平台通过云端托管、版本治理、数据集散布可视化,让客户的模型精度进步 30% 以上;通过平台自动化能力大幅缩短了客户模型迭代的周期,单次模型训练节约 25% 人工成本。
客户痛点
非结构化数据集难治理、模型开发流程割裂而效率低下
安吉智能是上汽安吉物流旗下专一于智能物流解决方案的服务商,业务笼罩上汽安吉物流外部的同时,也向汽车制作、机械电子、医药冷链、日化服装等行业企业提供相干技术服务。
对于物流行业,平安管理工作是重中之重。上汽安吉物流在全国范畴内治理 10 个港口、300 多个网点、5 万多名员工,为了保障如此宏大的物流零碎可能平安有序地运行,上汽安吉物流每年破费了上亿元用于雇佣了安保人员,但随着业务规模的扩充,适度依赖人力的传统安防模式曾经无奈满足倒退需要。
针对物流行业平安治理中的痛点问题,安吉智能自主研发的“安眸智能视觉管理系统”,利用计算机视觉技术对港口、园区、仓库等物流业务场景中的外围元素“人员、货物、设施”进行辨认和剖析,并对呈现的违反平安治理标准的问题及时揭示和采取相应措施,相较于在预先做出相应措施的传统安防,“安眸智能视觉管理系统”在危险产生之前进行预测监控,化被动为被动,无效的防止缩小危险和损失。
因为计算机视觉模型通常只能对事后训练过的场景和物体进行辨认,然而面对上汽安吉物流治理的 10 个港口、数百个网点、以及其对外服务的 200 多个客户一直提出的各异的性能需要,安吉智能的研发团队须要一直获取新的样本数据,并在不扭转边缘算力的前提下,对 AI 模型进行一直的更新和运维。
因而,安吉智能须要解决 AI 模型频繁迭代过程中的多个工程化难题。例如,针对迁徙学习时模型会产生旧数据忘记的问题,安吉智能曾经通过自研常识蒸馏、混合学习等技术让模型在学习新的数据特色后取得新的辨认能力的同时,也保留原先的辨认能力。但安吉智能依然须要应答以下两点次要的问题:
1)不足对非结构化数据集进行精密治理的能力
安吉智能有大的图像数据集,但每个网点或客户提出新的性能需要时,其提供的图像数据的采集工夫、采集指标、标注类别等信息都不统一,安吉智能须要将这些数据增补进原先的数据集中,记录数据集的层次结构,并造成不同的数据版本,从而用于模型误差剖析和模型重复迭代。
然而之前基于文件夹的手动治理形式,不仅很难追踪过来版本的模型和数据集的对应关系,在上百甚至更多个网点和客户都提出需要时,其数据版本就很难以文件夹的模式进行治理。
2)模型开发流程割裂,手动执行效率低下
因为模型开发中数据的收集、筛选、标注,以及模型训练等流程都处于割裂的状态,安吉智能须要依附算法开发人员层层把控,手动执行各种操作。当模型的迭代更新变得十分频繁时,这样的流程会十分耗时耗力,甚至无奈实现。
解决方案
依靠非结构化数据平台,保障模型迭代中的高质量数据供应和流程自动化
面对模型频繁迭代,以及由此带来的大幅增长的数据管理需要,安吉智能抉择与格物钛智能科技进行单干,将格物钛的非结构化数据平台作为安眸零碎研发中的 AI 基础设施组件之一,以解决其痛点需要。
针对非结构化数据集治理中的难题,格物钛为安吉智能提供了如下解决方案:
1)在云端对数据进行对立托管
安吉智能各个网点的数据都存储在云端,格物钛的数据管理平台全面托管了安吉智能的原始数据、标注数据和元信息。在平台的权限治理性能保障数据拜访平安的前提下,安吉智能的团队能够在平台上不便地拜访数据和进行团队合作。
2)数据版本可追溯
安吉智能每月或每周会在数据集内新增图片和物品类数据,通过格物钛数据平台,安吉智能在新增的数据上做标注,而后合并进原有数据集,并打上标签,从而造成新的标准化的数据集版本。算法工程师只须要依据标签就能找到须要的数据集版本,并比拟各个数据集之间的差别。
数据集散布特色可视化。格物钛数据平台的可视化组件能让算法工程师从宏观层面查看数据集的特色散布,以及从宏观层面查看单个文件和标注数据。安吉智能的算法工程师因而可能在模型训练前间接查看数据标注信息,也能够在模型训练后将预测后果作为一个数据版本,与人工标注的数据版本进行比拟,从而判断模型成果和数据标注品质。
针对模型开发流程割裂、手动执行效率低下的问题,安吉智能通过应用格物钛非结构化数据平台的 Action 性能,并联合了一些自研算法,对数据收集、数据标注、模型训练等要害流程设置工作主动触发机制,并让整个流程实现自动化。
在数据收集阶段,安吉智能通过自研图像类似度和品质剖析的算法,当发现符合要求的图像后主动在摄像头中进行抽帧并将图像上传至云端;在数据标注阶段,通过应用格物钛数据平台,当合乎须要的图片数据达到一定量级后,平台主动触发数据标注工作,而后通过签约的数据标注公司在平台上对数据进行标注,再与原先的数据集进行合并。在模型训练阶段,当平台监测到数据标注实现造成新的数据版本后,会主动先进行模型训练,而后对更新后的模型的预测后果进行评估,辨认预测成果不好的图片,并在平台上对数据标注实时地进行调整。
计划成果
模型精度进步 30% 以上,迭代周期大幅缩短,单次模型训练老本节约 25%
首先,格物钛非结构化数据平台为安吉智能实现了模型开发中的高质量数据供应。借助平台的云端托管、版本治理、数据集散布可视化等性能,安吉智能解决了模型迭代中的多种数据痛点,缩小了数据收集、数据筹备和模型评估中大量手工操作,让算法工程师能够专一于用 AI 模型去解决业务问题,模型精度能因而能进步 30% 以上。
其次,平台的自动化能力大幅缩短了安吉智能模型迭代的周期,节约单模型训练的人工成本。安吉智能预期因而能够实现每周对模型进行一次迭代更新,从而上线新的辨认性能,最终全年能上线 50 个辨认性能,并且单次模型训练能节约 25% 的老本。
经验总结
格物钛助您精密治理非结构化数据
1)以 AI 利用的复杂性,其在产业中落地的一大瓶颈通常在于数据的品质和匹配度。对于大部分传统企业而言,其数据量无限,研发能力也绝对有余,如果把 AI 利用开发的重心放在改良算法上,成果往往并不如意。因而,传统企业在 AI 利用开发中应该把重点放在取得品质更好、匹配度更高的数据上,帮忙进步模型成果,让 AI 利用更好地落地。
2)企业在 AI 模型开发或迭代频次较低时,其数据管理能够通过文件夹模式手动治理,但随着 AI 利用的减速落地,企业每年须要开发几十甚至更多个模型的时候,手动治理的形式将难以为继。此时企业应该抉择标准化的工具对模型开发中须要的数据进行高效治理,从而保障模型的继续迭代和更新。同时思考在流程中引入自动化能力,进一步缩短模型迭代周期。
数据驱动的智能时代未然降临,格物钛将是您把握时机的得力搭档!
更多信息请拜访格物钛官网