乐趣区

关于阿里云:使用-LifseaOS-体验-ACK-千节点分钟级扩容

作者:阿里云 ACK 和操作系统团队

三年前的云栖大会上,LifseaOS 正式公布,这是一款专为云原生场景而垂直优化的操作系统发行版,即业界统称的 ContainerOS。初始公布时,它提供了如下几个突出的个性: 轻量(Lightweight)、疾速(Fast)、平安(Secure)、镜像原子治理(Atomic)

现在 LifseaOS 已在阿里云容器服务 ACK Pro 的托管节点池取得宽泛应用,通过一年多的打磨优化,它在基于 Kubernetes 的云原生集群中正展现出越来越多的独特劣势,本次所介绍的即为 LifseaOS 在扩容弹性上所展现出的极速劣势。

两秒启动 OS,分钟级千节点扩容

在 ACK 集群中实现弹性扩容,是一项根底、要害且被重度依赖的能力。尤其是在集群资源池缓和或者有余时,如何疾速扩容节点、复原资源水位对用户业务至关重要。

在节点主动伸缩场景 ,ACK 通过组件轮询判断集群内资源是否短缺,一旦呈现有余则主动触发扩容节点。如果在这种状况下,节点扩容速度慢,则会重大影响主动伸缩成果,甚至因为资源水位长期有余而影响用户业务。目前的节点扩容速度在 ACK 节点主动伸缩端到端耗时中占比超过 90%,能够说节点扩容速度的优化的水平决定了主动伸缩的体验。

以某量化公司的扩容场景为例,在其长期提供服务的过程中,通过了上千次百节点级别的扩容流动,均匀每次扩容 P90 节点就绪耗时(即单次扩容流动开始至 90% 的节点处于就绪状态)为 162s,耗时较长。若能将扩容流动耗时压缩至 1min 以内,将大幅提高用户在节点扩容场景中的体验。

基于此,LifseaOS 针对 ACK 集群节点池的弹性扩容场景,实现了极速扩容的个性。

一方面,LifseaOS 通过简化 OS 自身的启动流程大大提高了 OS 启动速度。它裁剪掉了大量云上场景无需的硬件驱动,必要的内核驱动模块批改为 built-in 模式,去除了 initramfs,udev 规定也被大大简化,OS 首次启动工夫从传统 OS 的 1min 以上降落到了 2s 左右。

另一方面,LifseaOS 联合 ACK 场景进行了定制优化。它通过预置集群管控必备组件的容器镜像以缩小节点启动过程中因镜像拉取而带来的耗时,并联合 ACK 管控链路优化(例如调节要害逻辑的检测频率、调整高负载下零碎瓶颈中的限流值等),极大地提高了节点扩容速度。

LifseaOS 在节点弹性扩容场景上,相比于传统 OS 计划有十分大的劣势,且并发启动的节点数目越多,LifseaOS 的劣势越显著!如下图所示,并发启动 1000 个节点时,P90 节点就绪工夫 CentOS 为 380s,而 LifseaOS 仅需 53s,实现了分钟级别的千节点扩容体验!!!

升高 OS 运维累赘,专为容器场景深度优化

在 ACK 节点池中应用 ContainerOS(基于 LifseaOS),相比传统的 Linux OS 而言,ContainerOS 为容器场景深度优化,具备更加平安、轻量、启动疾速、不可变镜像等长处。

  • 轻量(Lightweight)

LifseaOS 默认集成 Containerd、Kubernetes 组件,仅仅保留 Kubernetes Pods 运行所需的零碎服务与软件包,相比传统操作系统(Alibaba Cloud Linux 2/3、CentOS)软件包数量缩小 60%,镜像大小缩小 70%。

  • 疾速(Fast)

LifseaOS 裁剪掉了大量云上场景无需的硬件驱动,必要的内核驱动模块批改为 built-in 模式,去除了 initramfs,udev 规定也被大大简化,大大晋升了启动工夫,OS 首次启动从传统 OS 的 1min 以上降落到了 2s 左右。

  • 平安(Secure)

LifseaOS 根文件系统为只读权限,只有 /etc 和 /var 目录能够满足根底的系统配置需要。去除了 sshd 服务与 python 反对,缩小 sshd CVE 破绽带来的威逼。同时将 OS 的惯例运维 API 化,缩小用户间接登录零碎进行一些可能无奈追溯的黑屏操作而带来的稳定性、安全性危险。不过,LifseaOS 依然提供一个专用的运维容器用以登录零碎,满足紧急的运维需要,运维容器须要通过 API 按需拉起,默认不开启。

  • 镜像原子治理(Atomic)

LifseaOS 不反对单个 rpm 包的装置、降级和卸载,通过 ostree 技术,将 OS 镜像版本化治理,更新操作系统上的软件包、或者固化的配置时,须要以整个镜像为粒度进行更新(或回滚),尽可能保障集群中各个节点的软件包版本与系统配置的一致性。

ContainerOS 联合 ACK 托管节点池的自动化治理能力,包含节点疾速 CVE 修复、节点自愈、镜像主动降级等,可能进一步升高用户在 OS 运维方面的管理负担,让用户更加关注下层利用。

开始体验 LifseaOS 吧

LifseaOS 是 Linux Base 操作系统,专门为容器场景而特地优化,与 ACK 的深度集成,用户能够开箱即用实现集群内疾速的弹性扩容。

目前 LifseaOS 已在 ACK Pro 1.24.6 及以上版本集群的托管节点池中凋谢(产品状态即为下图中的 ContainerOS)。

您能够返回 ACK 产品控制台创立基于 LifseaOS 的托管节点池,参考下图。当初开始玩转 LifseaOS 吧。

OpenAnolis 龙蜥社区曾经成立了 ContainerOS 的特地兴趣小组,LifseaOS 相干代码也将奉献到龙蜥社区,敬请大家期待,更多信息请返回下方链接查看:https://openanolis.cn/sig/container-os

点击此处,即可查看阿里云容器服务 ACK 产品详情

退出移动版