阿里云叔同以容器为代表的云原生技术已经成为释放云价值的最短路径

90次阅读

共计 4563 个字符,预计需要花费 12 分钟才能阅读完成。

作者 | 丁宇(叔同)阿里云智能容器平台负责人

云计算、大数据、人工智能等新技术正迅速的改变着我们所处的时代,其巨大的影响力已经从量变到质变,数字化转型成为企业发展的必然选择。据 IDC 报告,全球前 1000 的大企业中,67%的企业已将数字化转型变成企业级战略,企业数字化转型也正成为许多中国企业的核心战略。随着企业上云成为业界趋势,全面使用开源技术和云产品构建软件服务的时代已经到来。如何更好地拥抱云计算、拥抱云原生、用技术加速创新,将成为企业数字化转型升级成功的关键。

如何在数字化时代实现弯道超车?云原生开辟了一条捷径

阿里云原生应用平台研究员丁宇(叔同)在 2020 阿里云线上峰会上也提到了“以容器为代表的云原生技术,已经成为释放云价值的最短路径,云原生助力企业全面拥抱云计算”。在他看来,很多企业在数字化转型的过程中,付出了不少的努力与时间,但因为对云原生缺乏了解和实践经验,加之没有好的技术与产品来支撑,导致走了不少弯路。

我们知道,传统的开发模式在迭代速度、频率以及运维方式都难以满足市场快速变化的需求,而云原生追求的就是最大化地利用其技术模式,充分发挥云计算的生产力,使得应用从设计、开发、交付、到管理的思维方式与最佳实践有机结合,从而让这个应用可以最快地创造价值,也就是丁宇所说的“最短路径”。以容器技术为例,容器就是在虚拟化的基础上向上封装了一层,作为云平台与客户交互的新界面之一,应用的构建、分发和交付在容器层面实现标准化,对于企业而言,可以大幅降低 IT 实施和运维成本,从而提升业务创新的效率。

叔同提到:“阿里云的核心优势之一就是阿里巴巴的核心业务运行在云上,形成最好的创新土壤,最先进的技术首先会在阿里巴巴自己的业务体系中进行尝试,得到了大规模的运用,证明其技术的普适性与价值后再开放给客户。”

从 2011 年迈进容器大门算起,阿里的云原生之路已经走了十年。这期间经历了十年双 11 的历练,例如 2015 年全面容器化帮助双 11 大促实现快速弹性扩容。由于业务的超大规模使得其复杂程度非常高,这也为容器技术带来了更大的挑战。例如在容器镜像分发过程中,一次发布分发几万个镜像,这样巨大的流量是一个不小的挑战。为实现效率的极致要求,阿里云利用 P2P 技术,实现大规模大批量的快速分发,实现 10 秒内完成跨机房镜像下载容器启动。容器技术对于双 11 的显著影响还包括在具体的混部技术实施中,通过混部技术,阿里巴巴集团范围内能够节省 30% 左右的 IT 成本支出,在双 11 这个特殊时间段里,将每万笔交易成本下降超过 75%。

Gartner 今年 4 月发布 2020 年容器公有云竞争格局报告,阿里云再度成为国内唯一入选厂商。报告显示,阿里云容器服务在中国市场表现强劲,产品形态丰富,在如 Serverless 容器、服务网格、安全沙箱容器、混合云和边缘等领域,具备良好的技术发展策略。而在今年 3 月,Gartner 第二次公开《竞争格局:公共云容器服务》年度调研报告,报告针对 Serverless、Kubernetes、服务网格、容器镜像等十项功能维度进行对比,阿里云和 AWS 覆盖九项产品能力,产品丰富度领先 Google、微软、IBM 和 Oracle 四家厂商。

云原生裸金属,挑战性能极致,全新升级最短路径

过去几年,容器服务被各行业企业广泛接受,而阿里云凭借业界最丰富的容器产品家族和容器服务,已经连续数年以超 400% 的规模高速增长。在 2020 阿里云线上峰会上,阿里云智能基础产品事业部高级研究员蒋江伟重磅发布了云原生裸金属方案。

新一代容器服务 ACK,可以将最新神龙弹性裸金属实例的强大性能发挥得淋漓尽致,具备 极致性能、高效调度、全面安全 的特点:

  • 新一代神龙架构具备业界第一的 I/O 转发能力,提供最高 100G 网络带宽;阿里云高速 Terway 容器网络通过网卡直通和数据平面加速,延迟下降 30%。
  • 第 7 代实例最大支持 192 个 vCPU。ACK 智能 CPU 调度可以轻松释放强大算力,无需应用调整可以实现 QPS 20~30% 提升;结合 ENI 网卡密度提升,可以缩减 50% 的计算成本。
  • 弹性裸金属实例支持阿里云安全容器,提升端到端安全隔离能力,与开源方案相比 性能提升 30%,也支持阿里云 首发机密计算容器,基于软硬一体技术有效保护数据隐私。

在阿里巴巴内部,容器 + 神龙裸金属方案以超高性能支撑钉钉抗住有史以来最大的流量洪峰。以前,钉钉 100% 部署在普通物理机上,疫情突发之后,政府、企业和学校对在线协作的需求猛增。通过云上神龙裸金属 + 容器弹性部署方案,快速地实现了钉钉业务应用 10 万核扩容需求。

在外部,尤其是在这次疫情影响下,很多企业面临快速扩容的压力,如在线教育行业,短时间内爆发式的需求,对于任何一家在线教育企业既是机遇,更是挑战。据百家云 CEO 李钢江透露,疫情期间百家云的业务量在短时间内增长了数十倍,要满足如此迅速的扩容需要,还要在客户无感知的情况下完成扩容,其难度不亚于交付一个新系统。

幸运的是,在这场流量战役之前,百家云已经在阿里云团队的帮助下,优化了自身容器集群架构与规划,通过阿里云容器服务 ACK、基于神龙架构的弹性裸金属实例的核心方案,足以从容应对流量洪峰。相比之下,一些没有使用容器的在线教育企业,面对突增的用户量和流量,只能成倍的堆积机器,导致部署时间拉长,业务成本急剧上涨,用户体验也不佳。

为什么要采用神龙裸金属 + 容器弹性部署方案?因为百家云的需求是三天扩容数十倍,并且百家云的 K8s 集群对性能要求极高,而“容器 + 弹性裸金属”的解决方案非常契合这种大流量、高并发的场景。首先,阿里云弹性裸金属服务器规格较高,可以帮助百家云显著提升单个节点的容量。

其次,基于容器化构建方式,可以满足业务快速发放和弹性的要求。神龙服务器完全消除了虚拟化损耗,提升了 8% 的计算性能,其类物理机特性,可进行二次虚拟化。神龙的性能,加上容器的弹性,形成了天作之合。数据显示,容器运行在云上神龙反而比非云物理机的性能要好 10%-15%。主要是因为虚拟化开销已经 offload 到 MOC 卡上,神龙的 CPU/Mem 是无虚拟化开销的,而上云后运行在神龙上的每个容器都独享 ENI 弹性网卡,能提升 13% 的网络吞吐量。

第三,神龙服务器的存储带宽和计算带宽分离,能满足百家云业务场景的大量读写需求。使用神龙服务器之后,计算能力大增。并且,百家云通过使用阿里云的高性能 NAS 服务,并通过水平扩展为 4 个集群,解决了 I / O 的瓶颈。

基于以上方案,借助自身的大规模集群管理能力,在短短几天之内,阿里云团队帮助百家云团队有效升级了原有的架构方案,实现了数十倍的扩容,大幅提升了其性能与稳定性,并拥有了应对爆发性规模的能力,用户毫无察觉。

丰富的云原生产品和解决方案背后,阿里云用四个最来践行最短路径

阿里云在云原生领域的投入广泛而深入,在容器、服务网格和 Serverless 均有丰富的产品服务,目前阿里云已经拥有 国内最丰富的云原生产品家族、最全面的云原生开源贡献、最大规模的云原生应用实践、最大的云原生客户群体。其产品体系覆盖八大类别 20 余款产品,涵盖底层基础设施、数据智能、分布式应用等,可以满足不同行业场景的需求。

阿里云是国内在云原生领域的开源贡献最全面的科技公司,涵盖编排调度、作业管理、无服务器框架等,主导维护 etcd、containerd、dragonfly 等多个 CNCF 明星项目的发展,已有超过 10 个项目进入 CNCF landscape。去年 1 月,阿里云资深技术专家李响成为首个入选全球顶级开源社区 CNCF 技术监督委员会的中国工程师,致力于推动云原生技术的落地。今年 5 月,阿里巴巴开源首个边缘计算云原生项目 OpenYurt,推动社区在云原生和边缘计算交叉领域的协同发展。

近日,云计算开源产业联盟在 OSCAR 开源先锋日云原生专场活动上公布了“云原生应用十大优秀案例”评选结果,由阿里云提供技术服务的申通通用云原生计算平台和中国民生银行的场景化数据服务中台双双入选,这次评选的四大标准是:面向传统行业数字化转型,规模化应用云原生技术,提升企业资源利用率及研发效率,助力企业业务创新发展。申通和民生银行两大案例因为在云原生和数据服务中台的技术实践中表现出色,最终脱颖而出。

以申通为例,原有 IDC 系统帮助申通早期业务快速发展,但也暴露了不少问题,传统 IOE 架构,各系统架构的不规范,稳定性,研发效率等都限制了业务发展需求。在跟阿里云多次技术交流之后最终确定阿里云为唯一合作伙伴,为申通提供稳定的计算,数据处理平台。

申通原架构是基于 VMware+Oracle 数据库的架构,通过上阿里云,全面转型基于 Kubernetes 的云原生架构体系。主要有两点:

  1. 应用容器化。跟虚拟机比起来,容器能同时提供效率和速度的提升,让其更适合微服务场景。通过应用容器化解决了环境不一致的问题,保证应用在开发、测试、生产环境的一致性。
  2. 微服务改造。原先很多业务是基于 Oracle 的存储过程及触发器完成的,系统之间的服务依赖也是通过数据库 OGG 同步完成。存在的问题是系统非常难维护,也非常不稳定。通过引入 Kubernetes 的服务发现来做微服务方案,按业务域进行拆分,让整个系统更易于维护。

目前申通核心业务系统已经在云上完成流量承接,每天处理订单量在千万级别,处理物流轨迹在亿级别,每天产生的数据量在 1T,使用 1300+ 个计算节点来实时处理业务。正如申通上云总负责人提到的,“申通通过阿里云进行全面转型,基于 Kubernetes 的云原生架构体系,在成本、稳定性、效率、赋能业务四个维度获得显著成效,这些云原生技术带来的价值,是申通转为使用公有云作为主要计算资源的核心驱动力。”

在容器技术上,阿里云的目标是构筑新基石、新算力、新生态。帮助企业更好地支撑混合云、云边一体的分布式架构和全球化的应用交付。据 Gartner 分析,未来 80% 以上的企业都会采用混合云的架构,打造混合云和云边一体的方案也是阿里云一直在关注的方向。未来云的架构是动态、混合的架构——云边端一体,公共云能力向边缘设备端拓展,需将计算能力、AI 推进到边缘,容器提供一致化的方式对云边端进行统一的应用部署和交付。基于云原生软硬一体化的创新技术,通过阿里云提供的强大算力来加速企业的智能化升级:容器服务结合神龙架构发挥性能和弹性,支持含光 800 芯片的调度、共享,极致优化深度学习场景的效率、成本。

容器、Kubernetes、云原生正在成为云时代的技术新标准,重塑整个软件生命周期,阿里云通过云原生正在帮助企业客户和开发者最大化利用云的能力,最大化发挥云的价值。

课程推荐

为了更多开发者能够享受到 Serverless 带来的红利,这一次,我们集结了 10+ 位阿里巴巴 Serverless 领域技术专家,打造出最适合开发者入门的 Serverless 公开课,让你即学即用,轻松拥抱云计算的新范式——Serverless。

点击即可免费观看课程:https://developer.aliyun.com/learning/roadmap/serverless

“阿里巴巴云原生关注微服务、Serverless、容器、Service Mesh 等技术领域、聚焦云原生流行技术趋势、云原生大规模的落地实践,做最懂云原生开发者的公众号。”

正文完
 0