关于容器:阿里云ECI如何6秒扩容3000容器实例

简介: 2021年云栖大会现场,阿里云工程师演示了在6秒工夫内胜利启动3000个ECI,并全副进入到Running状态。本文将为你揭开阿里云ECI是如何做到极速扩容的。

引言

依据最新CNCF报告,有超过90%的用户在生产环境应用容器,并且有超过80%的用户通过Kubernetes治理容器。是不是咱们的生产环境上了K8s就完满解决了利用部署的问题?IT界有句俗语,没有什么是万能的,K8s也不是万能的,K8s解决了利用的编排和调度,但没有解决资源容量的限度、没有解决容器的平安隔离,以及昂扬的运维老本。

传统K8s的问题和窘境

资源效率低

这个资源柱状图来自阿里云一个客户,业务的流量高峰期CPU大略在7000-8000核,在流量低谷期只有几百核CPU的应用。如果在做IT布局或者购买资源时,依照峰值流量去布局资源,会导致重大的资源节约。但如果依照使用量去实时布局ECS资源,又会导致在面对一些突发流量时无奈及时扩容,影响服务的稳定性。

资源隔离弱

容器应用零碎内核的namespace进行资源隔离,但内核仅反对UTS、IPS等6种namespace隔离。咱们遇到过一个客户,须要在测试环境批改某个业务Docker的工夫,后果导致一台机器上所有的容器工夫都被批改。还有定制内核参数、IO偏心分享等场景,也有雷同的问题。

同时,容器平安也始终被大家诟病,例如特权容器间接能够看到机器上所有的磁盘数据。

运维老本高

云原生为IT带来了很多便当,但同时云原生也让整个IT运维变得越来越简单。一个K8S容器集群,至多须要部署高可用Master、网络插件、镜像仓库、日志服务,以及监控组件。即使辛苦把这些组件装置实现,也要面对后续每天各种运维、告警的解决,运维每天是各种的救火。

阿里云弹性容器实例ECI应运而生

有没有一种免运维、并且可能按需应用的平安的容器解决方案呢?阿里云弹性容器实例应运而生了。

阿里云弹性容器实例(简称ECI,Elastic Container Instance)是阿里云联合容器和Serverless技术提供的容器运行服务。通过应用ECI,在阿里云上部署容器时,无需购买和治理云服务器ECS,能够间接在阿里云上运行Pod和容器,省去了底层服务器的运维和管理工作。简略来说,一个ECI就是一个Pod,能够被K8s编排和调度。

阿里云弹性容器实例特地实用于突发的业务流量,或者短周期的工作运行。那么ECI和客户本人去购买ECS,在ECS里运行Docker有什么区别呢?最大的区别在于如果应用ECI,整个容器的运行时会将由阿里云来运维。

ECI有以下长处:

  • 底层资源由阿里云托管,用户不再须要治理底层VM(虚拟机)。
  • 复用整个阿里云的弹性计算资源池,保障短缺的库存。
  • 低成本,按秒计费,从Pod开始创立时免费。
  • 启动快,秒级启动底层平安沙箱。
  • 兼容性强,齐全兼容K8s。

阿里云弹性容器实例采纳社区的Virtual Kubelet计划与K8s集成,当集群内有Pod创立并调度到Virtual Kubelet时,Kubelet就会调用ECI接口,启动ECI。

ECI与业务零碎的对接形式包含:

  • (举荐)通过阿里云容器服务Serverless Kubernetes(ASK)部署业务,提供无需运维的Kubernetes集群能力,底层Pod资源全副应用ECI承载。
  • (举荐)通过阿里云容器服务Kubernetes(ACK)部署业务,为ACK集群提供额定的海量弹性能力。
  • 通过Virtual Node对接用户在ECS上自建的Kubernetes集群,提供方便快捷的弹性计算资源。
  • 通过Virtual Node对接用户在线下IDC自建的Kubernetes集群,提供云上的有限弹性计算能力。
  • 通过OpenAPI间接对接业务零碎,低成本的随时创立或开释ECI业务容器。

ECI极速启动实例:6秒钟3000个容器实例

在2021年云栖大会现场,阿里云Serverless容器服务弹性容器实例公布了极速启动实例新个性。弹性容器实例在解决上述利用部署问题的根底上,翻新的提供极速启动的产品个性。现场演示了在6秒工夫内胜利启动3000个ECI,并全副进入到Running状态。

阿里云是如何做到6秒钟启动3000个容器实例?

一方面,通过大量用户级别的创立历史数据,利用机器学习找出用户创立Pod的法则,通过预测预调度、资源复用等伎俩,节俭ECI的调度、创立工夫,同时应用了阿里云袋鼠沙箱容器作为引擎,辅以overlay网络、存储计划,将单ECI实例冷启动工夫压缩到了3秒以下,针对袋鼠引擎后续会有专门文章进行具体的介绍,也敬请大家期待。

另一方面,在镜像拉取维度,通过镜像缓存把容器镜像做成快照,免去每次启动Pod拉取容器镜像的动作,例如阿里云的达摩院AI团队局部镜像能够达到几百G,如果依照传统形式拉取须要十几分钟,通过ECI的镜像缓存计划能够实现Pod秒级启动。

展望未来

阿里云弹性容器实例提供了从Runtime、GuestOS、底层计算、网络、存储资源的免运维全托管服务,并在2021年云栖大会上公布了极速的实例启动速度,帮忙客户快捷的实现业务零碎扩缩容。

随着云厂商服务边界的进一步上移,ECI冀望通过规模化、集约化的资源调度和端到端的Runtime设计,提供相比客户自建容器资源池更好的弹性、性能和老本能力,这将是将来1-2年阿里云弹性容器实例继续摸索的方向。

原文链接
本文为阿里云原创内容,未经容许不得转载。

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

这个站点使用 Akismet 来减少垃圾评论。了解你的评论数据如何被处理