共计 3782 个字符,预计需要花费 10 分钟才能阅读完成。
作者:徐果、冰羽、瑶靖
主动驾驶被认为是推动智能汽车倒退的里程碑式技术。数智化大潮下,公众对汽车的定义和需要都产生了巨大变化,汽车的性能已不再是简略的交通工具,而是逐步演变为一个个“超级智能终端”。
然而,老本和效率始终是制约主动驾驶大规模商用的重要因素。得益于 Kubernetes 和云原生技术在边缘场景的拓展和利用,主动驾驶企业可能以更加高效率、低成本的形式解决数据、训练算法,将研发人员从硬件装备和日常运维治理等繁琐事务中解脱进去,把更多精力投入主动驾驶外围算法的研发及业务的增长中。
本文将通过介绍元戎启行应用阿里云边缘容器服务 ACK@Edge 的实际,分享在主动驾驶网约车场景下,如何将云边一体的云原生能力疾速笼罩到泛滥智能车载设施,无效升高主动驾驶车辆管理老本。
为什么说“云边协同”是主动驾驶倒退的加速器?
元戎启行科技有限公司是一家专一于研发和利用 L4 级主动驾驶技术的科技公司,领有主动驾驶乘用车“元启行”和主动驾驶轻卡“元启运”两大产品,次要是为车企、Tier1、出行公司等提供定制化的主动驾驶解决方案。其中,Robotaxi 出行搭载元戎启行自研 L4 级主动驾驶解决方案,通过自营车队和单干经营的模式落地。元戎启行 L4 级主动驾驶前装计划车队已投入经营,为乘客提供城市出行服务。
在业务快速增长的迫切需要下,车载设施在高并发场景下的性能要求与计算资源受限的矛盾、车载环境云边网络不牢靠与车载业务谋求可靠性的矛盾、企业迅速响应需要变动的诉求与传统运维伎俩低下的矛盾、云端管控车载设施以及车载设施对安全性高要求的矛盾等,都会为元戎启行进入高阶主动驾驶量产过程中的老本和效率带来挑战。
面临的挑战
- 零碎可扩展性差,车载应用环境依赖抵触 :在主动驾驶畛域,车载业务的传统的交付模式大多数以 deb/rpm 包的形式部署,对车载运行环境的依赖性比拟强,不同业务对系统库的依赖版本可能会抵触;此外,因为算法模块的数量一直增多,单个模块又须要依赖更多的模块,因而不能疾速搭建与复现 bug 产生时的运行零碎环境,给研发调试带来许多困扰。这些都可能给车载线上业务、路上车辆的失常运行带来隐患。
- 环境不统一导致研发运维效率低 :理论业务中仿真与车上环境不统一,仿真环境始终放弃容器环境运行,然而车上保留的则为 deb 的部署形式;此外,以 deb/rpm 包等传统的部署形式须要较多的人工干预,容易造成车辆业务部署和运行时测试及研发迭代效率低的问题。
- 短少全局管控能力 :对于路测车辆,许多研发人员须要在车端调试需要,因为车载运维条件无限,影响调试工作的效率;此外,线下经营的车辆越来越多,车载业务的降级、运维、监控等都面临较大挑战,须要一个从全局视角对线下经营车辆业务的对立治理和部署的能力。
- 短少云端一体化交付能力 :现阶段云原生在云上曾经成为事实标准,主动驾驶车企能够在云上应用云原生 + AI 的能力,进行大量的 AI 模型训练和仿真业务的运行。然而当 AI 模型和仿真业务训练好后,如何将这些制品疾速高效的交付到车端,也是车企所面临的问题。若独自开发一套平台来专门保护车端利用,不仅带来额定开发和保护老本,而且和云端业务的 CI/CD 流程呈现割裂,因而车企也心愿通过云原生的能力治理边缘侧的车载业务,进行云端一体化交付。
- 车载网络安全问题 :网络安全对于主动驾驶的重要性曾经毋庸置疑,通常状况下车端利用始终要和云端放弃通信,以监听云端下发的工作,而车端又是一个很容易和内部人员产生物理接触的环境,尤其是网约车经营模式的主动驾驶场景。如果车端被歹意侵入,入侵者有可能通过这条链路侵入云端,甚至进一步影响和云端有连贯的所有车辆,这就对车端利用提出了十分高的平安诉求,显然,这会大大减轻利用开发人员的累赘。
- 弱网 / 断网环境下的车载业务自治能力 :在以网约车经营模式的主动驾驶车辆,在线下运行时,因为车辆所处的地位的不同,很可能处于弱网或者断网的状况,在这种状况下,如何能保障车载业务在极其重启状况下稳固运行,这也是车企所急须要解决的问题。
- 车辆监控 / 日志采集 :大量的经营车辆在行驶过程中,须要监控车辆的硬件温度、CPU、内存等控件的使用率,时刻在云端监控大屏上显示,另外云端须要车辆上零碎和利用的要害日志采集,用来日志剖析,以后并没有通用且无效的办法去解决。
ACK@Edge 助力元戎启行车云一体化协同
ACK@Edge 云边端一体化利用劣势
主动驾驶场景是云原生在云边协同场景下的很好用例:车载设施能够作为云边协同的计算节点,对立接入到云端,由云端对立管控,同时应用云原生的能力,能很好保障车载上业务之间的环境隔离问题,能够对于主动驾驶车载利用零碎在云上进行对立降级更新、资源调度、运维管控,实现云端一体化交付。
阿里云边缘容器服务(简称 ACK@Edge)是一款提供规范 Kubernetes 集群云端托管,反对边缘计算资源、业务疾速接入、对立治理、对立运维的云原生利用平台,可能帮忙用户轻松实现云边一体化协同。用户利用 ACK@Edge 通过纳管边缘节点将云上利用延长到边缘,联动边缘和云端的数据,使得边缘节点领有云端雷同能力。在云端提供对边缘设施、边缘利用的对立 Ops 能力,保障边缘设施及边缘智能利用少运维、高可用。
目前 ACK@Edge 曾经全面降级为基于云原生的云边一体和云端一体架构,可能适配更多的垂直畛域的边缘计算场景,另外在云端协同场景,车载设施、交通、桥梁等小终端设备的轻量化接入,减速您容器化利用的散发、运维,升高您自建运维的老本。除主动驾驶外,已宽泛用于 CDN、IDC、IoT、智慧物流、工业大脑、新批发等诸多场景。
ACK@Edge 主动驾驶解决方案助力元戎启行云边协同
基于 ACK@Edge 云边一体、云端一体,Kubernetes 容器编排调度的能力,以及 ACK@Edge 在 Kubernetes 之上针对边缘场景叠加的如轻量化、OTA,边缘侧 POD 离线启停,边缘自治、边缘单元化、单元化部署、Tunnel 通道的能力,切实解决了元戎启行智能在主动驾驶畛域的相干痛点,最终承载了元戎启行主动驾驶线上经营车辆,为乘客提供城市智能出行服务。
ACK@Edge 在原生 Kubernetes 的根底上针对主动驾驶场景提供了独有的增强型性能:
- 云端运维,近程调试 :ACK@Edge 提供的 Tunnel 通道,能够让业务人员疾速查看容器日志和进入容器调试。同时利用 tunnel 通道能够将车载设施的监控信息(硬件温度,CPU/ 内存使用率等)对立收编到云上,为元戎云端平台提供监控和告警服务。
- 边缘自治 :ACK@Edge 的边缘自治能力,能够在经营车辆离线、或者车辆重启这种极其状况下,还能保障车载上的的业务能失常运行。期间,ACK@Edge 团队与元戎零碎团队做了大量的断网、重启操作,最终在证实经营车辆上的业务可能失常运行。
- 轻量化接入 :ACK@Edge 在云端场景下,提供轻量化接入的能力,边侧组件具备更少的资源占用率。更少的资源占用率能够为业务腾挪出更多的资源,进步了车载利用对摄像头视频流的解决能力,进一步提高主动驾驶车辆的反应速度。
- 车载利用的 OTA:因为主动驾驶场景对于车辆运行平安要求十分刻薄,对车辆上的利用降级有着十分高的要求,原生的 Kubernetes workload 的降级回滚形式还是显得比拟暴力,针对这些非凡场景,ACK@Edge 创新性的提出了针对于 POD 的 OTA,以及在离线场景下 POD 的启停治理能力,此性能能够很好的满足经营车辆的依据过后的状况按需降级,以及在极其状况下管理人员人工接入运维的需要。
计划亮点和成果
- 对立的交付规范 :应用 containerd+ACK@edge 来交付利用,交付流程简略,交付物规范,缩小和车端设施的耦合,且不会净化车端环境。
- 设施平安接入能力下沉,利用聚焦业务 :Lite-kubelet(车端设施上运行的 agent)反对一机一密认证拜访 MQTT,确保每台车载设施都用本人的设施证书接入至 ACK@Edge 集群,极大进步接入的安全性;且整个过程对业务层通明。
- 提供更丰盛、灵便的设施治理能力 :通过 OTA(SoftwareOverTheAir)、边缘侧 Pod 离线启停治理,进步了车载利用的公布运维效率。
相比拟传统的云原生工作负载节点治理形式,通过将元戎启行经营车辆的车载设施以轻量化形式接入 ACK@Edge,使设施接入资源占用升高 50 %,接入安全性大幅晋升。基于边缘侧 Pod 的启停、OTA 性能便捷化治理车载设施,业务公布运维效率晋升 60% 以上。
主动驾驶的将来:云原生 + 边缘计算双轮驱动
汽车产业的自动化曾经成为了不可阻挡的潮流,减速落地将会成为下一阶段的主题。置信云原生与边缘计算的联合可能帮忙更多汽车企业更好地排汇云计算、大数据和 AI 的成绩劣势,通过无效升高主动驾驶车辆管理老本,推动解决主动驾驶量产工程难题。
将来,将来 ACK@Edge 会持续深耕边缘计算畛域,拓展更多的业务场景,冀望推出更多的面向于垂直畛域的解决方案。同时,咱们也已将 ACK@Edge 全副外围代码奉献进去,成立了 OpenYurt 开源社区,并募捐给 CNCF,吸引 VMware、中国电信、浙大实验室、中国联通、中国移动等公司和组织的泛滥开发者参加。心愿能有更多企业和开发者退出咱们,通过继续凝聚社区实际,推动云原生边缘计算规范造成。
点击此处,理解 ACK@Edge 更多详情