关于人工智能:ACR-EE-全链路加速升级

23次阅读

共计 2340 个字符,预计需要花费 6 分钟才能阅读完成。

简介: 说到容器、云原生,置信大家肯定都很相熟了。随着云原生技术的遍及,越来越多企业客户基于云原生上云和架构转型。然而如何从端到端减速云原生利用,彻底开释云原生技术的红利呢?明天为大家带来了阿里云的最新计划,基于容器镜像服务企业版 ACR EE,从容器镜像构建减速、寰球散发减速、大镜像 / 大规模散发减速,全链路的减速降级。

【云原生利用减速发布会】传送门:https://yqh.aliyun.com/live/detail/22720
点击查看详情:https://yqh.aliyun.com/live/cloudnative\_release

(一)容器镜像构建减速,极速拉取多架构大镜像 / 海内源


云原生化的首站其实就是业务容器化革新,咱们要把利用以及利用依赖的环境打包成规范的容器镜像。在容器镜像构建的过程,很可能会依赖海内源(golang/yum/npm)或者海内的根底镜像,须要稳固的海内减速。或者业务须要多操作系统 / 多架构的版本输入,须要并发矩阵构建,便捷地测试多个版本。
ACR EE 提供 Serverless 化的容器镜像构建服务,反对多任务稳固 & 高并发构建。反对自建 GitLab/Codeup/Gitee/Github 多代码源绑定,以及代码变更后主动构建。通过海内源智能减速、多级缓存减速计划,相比开源构建计划,ACREE 均匀构建能提速 30 % 左右。此外,ACR EE 也提供了自定义版本、构建参数、业内首个多架构镜像构建的能力。反对构建实现后,触发器事件回调等体验降级,便于客户更灵便落地云原生 DevOps 场景。
新版 ACR EE 提供企业级构建服务,具备如「多代码源接入」、「大规模并发」、「多维度构建减速」、「体验降级」等个性。

(二)寰球散发减速,高效同步跨境镜像


接下来,让咱们看一下寰球散发减速,目前咱们有很多互联网企业出海和跨国合作客户,他们的研发核心可能国内,然而容器业务须要寰球多地区部署合作。因为跨海链路的不稳固导致了合作难、迭代慢的问题,然而自建专线链路,去保护一套简单的网络拓扑,又会带来微小的资源及人力运维老本。最终这些客户抉择应用 ACR EE 寰球减速能力,进步 85% 的散发效率,同时升高 300% 自建和运维老本。应用 ACR EE 寰球对立域名性能,实现了智能拜访就近实例,进一步升高客户多实例应用老本,晋升了服务可用性。
针对寰球散发减速的场景,咱们做了多维度的优化,晋升并保障了 99.95% 的跨海同步成功率和同步低延时。咱们通过专属链路、传输协定调优、多链路 QoS,实现链路层的优化。数据切片、数据去重、分层并发实现了调度层优化,最终保障客户的极致体验。
新版 ACR EE 加强了「链路优化」、「调度优化」、「平安合规」,尤其适宜有业务出海需要的企业释怀省心地实现跨海的 CI/CD。

(三)大镜像散发减速,GB 级镜像启动时长缩小 60%


那么其实除了寰球多地区的散发,越来越多的客户,也面临大镜像散发慢的问题。
比方,很多 AI 业务容器化后,他须要将算法模型、算法依赖库打包在容器镜像中,做离线工作解决,单镜像可能超过 5G。能够看左图,传统容器运行时,因为镜像 Layer 为 tar.gz 格局,无奈随机读取。咱们的 Node 节点须要将全量的容器镜像数据下载后再解压,然而容器实在的启动可能仅应用其中局部内容,导致容器启动耗时长甚至因为超时而无奈启动的问题。
ACR EE 提供了按需加载能力,可主动将规范镜像转化成减速镜像。减速镜像 Layer 为自定义带索引格局,反对高性能随机读取。在 Node 节点上基于减速套件实现镜像数据按需加载和在线解压。均匀启动工夫缩小 60%,按需散发效率晋升 3 倍,可享受大镜像秒速运行体验。此外,咱们也提供了基于 label 主动切换为减速镜像版本的能力,反对在 ACK 上透明化的容器业务应用。
新版 ACR EE 对大镜像极度敌对,「按需加载」、「减速镜像格局转化」、「体验降级」,非常适合 AI/ 离线工作利用、脚本语言利用、GB 级镜像。

(四)大规模散发减速,单集群百节点的疾速部署


随着一些 AI/ 大数据场景容器化遍及,单集群的节点数也在急剧增长,例如一些批量计算、基因计算业务,单集群节点数可能超过 100。当大规模容器节点批量下载镜像时,镜像后端存储(OSS)的网络带宽可能会成为性能瓶颈,导致镜像拉取慢或超时,影响业务的紧急扩容 / 变更。

 ACR EE 提供了 P2P 散发减速性能,利用计算节点的内网带宽资源,在节点之间散发镜像分片,大幅晋升镜像拉取速度,缩小利用部署工夫。目前,ACR EE 反对单集群千节点的 P2P 散发,相比于传统的镜像拉取,散发性能晋升 4 倍左右。ACREE 也反对 ACK、ASK 及 ACK+VK(ECS+ECI 并存)集群模式下的 P2P 散发,反对 Docker 和 Containerd 的容器运行时。此外,ACREE 也反对基于 label 主动切换至 P2P 散发减速,比方在某个利用负载、或某个空间打上 P2P 标签,ACR EE 会将以后一般镜像拉取主动替换为 P2P 减速链路,让客户的应用体验更加平滑。新版 ACR EE 对大规模业务更加敌对,尤其晋升了 100 个以上节点的单集群的部署体验,试验数据显示对于单集群 1000 节点散发性能较此前晋升 4 倍。

基于容器镜像服务企业版 ACR EE,从容器镜像构建、寰球散发、大镜像 / 大规模散发,全链路的减速降级,进步云原生利用构建、散发、部署的效率,助力企业云原生架构降级。

版权申明: 本文内容由阿里云实名注册用户自发奉献,版权归原作者所有,阿里云开发者社区不领有其著作权,亦不承当相应法律责任。具体规定请查看《阿里云开发者社区用户服务协定》和《阿里云开发者社区知识产权爱护指引》。如果您发现本社区中有涉嫌剽窃的内容,填写侵权投诉表单进行举报,一经查实,本社区将立即删除涉嫌侵权内容。

正文完
 0