关于阿里云:阿里云研究员祝顺民因云而生的云原生网络

6次阅读

共计 4127 个字符,预计需要花费 11 分钟才能阅读完成。

注:本文作者祝顺民(花名江鹤),阿里云智能事业群研究员、网络产品负责人,在软件定义网络(SDN)和网络性能虚拟化(NFV)畛域有多年技术研发和治理教训。率领团队从无到有,打造了业内最丰盛的云网络产品线,并研发了阿里云飞天零碎的云网络平台 - 洛神,历经 10 年双十一考验。

云计算的宽泛应用正在扭转云原生的定义,云原生正从广义的云原生定义,即“微服务 + 容器 + 继续交付 +DevOps”,向狭义的云原生定义转变,即“因云而生的软件、硬件、架构就是真正的云原生”。云网络作为云计算标配的 IaaS 外围产品线,第一天就是依云而生,更是生而为云的,是真正云原生的网络。

当中年的网络遇见牙牙学语的云计算

1969 年,美国国防部高级钻研打算管理局建设了一个名为 ARPAnet 的网络,这被普遍认为是网络的开始。ARPAnet 造成的 TCP/IP 体系结构和协定到明天还是网络世界的根底。随后的几十年里,网络在疾速倒退,到 2009 年,挪动网络从 1G、2G 曾经倒退到了 3G,咱们应用的利用也从最早的电话、短信倒退到图形、聊天、购物。这些利用的倒退都离不开网络,能够说网络的倒退驱动了利用的改革。同年,工信部正式为三大运营商发放了第三代挪动通信 (3G) 牌照,从这一刻起,中国正式进入了 3G 时代。

2009 年数据中心服务器的网卡大都还是 1000M,到了 2010 年 5 月 10 日,阿里云对外公布第一个商业化的产品 - 云服务器 ECS,正式提供公共云服务,标记着中国云计算公共云服务的开篇。

彼时,网络曾经倒退了 40 年,曾经步入中年,而云计算刚刚诞生,还是牙牙学语的新生儿,中年网络遇见新生云计算会碰撞出怎么的火花呢?那时候,可能很多人都没有想到,云计算对网络的影响会如此之大。

2012 年底,随着虚拟化技术的倒退,单物理机的虚构比在逐步提高,对网络设备提出了十分高的要求,过后全世界都曾经找不到满足业务虚构比的网络设备了。除此之外,过后的网络架构还存在老本、稳定性、性能等多方面的问题,这些问题极大地影响了云业务的发展。与此同时,随着更多用户上云,尤其是大型互联网企业和传统企业的上云,用户对云上网络管理需要也一劳永逸。比方,用户在云上多地区部署业务,须要多地区内网互通,或者用户须要把云下 IDC 和云上网络互通,构建混合云等等,而这些网络管理能力,过后云上的传统网络架构都难以满足。

中年网络和新生云计算产生了强烈的抵触,已到中年的网络必须翻新能力满足新生儿“云计算”的疾速倒退须要。

2012 年,阿里云率先放弃传统的大二层传统网络架构,设计新的网络虚拟化(Overlay)技术计划。2014 年阿里云虚构专有网络 VPC 产品正式上线,VPC 是中年网络和新生云计算联合的产物,VPC 也是云网络的标志性产品,验证了“网络 + 云计算 = 云网络”公式的成立。因而,从第一天起,云网络就是因云而生的。

云网络是天生具备云特色的网络

云网络因云而生,天生具备云的特色。

首先是资源共享。通过将网络资源虚拟化,应用 Overlay 技术实现多租户共享网络资源,但租户间又是平安隔离的。Overlay 技术让每个用户都能够像应用虚拟机一样应用云网络,包含应用虚构交换机 / 虚构路由器 / 虚构负载平衡等等。

其次是弹性伸缩。对于传统设施来说,设施买回来,解决性能就确定了,难以弹性伸缩。云网络为了应答弹性伸缩的,将管制面与转发立体进行拆散部署,并且采纳集群的形式反对扩大,联合网络虚拟化技术为每个用户提供了弹性网络能力。

再次是自助服务 。这是从用户视角看到的云网络与传统网络的最大区别。传统网络须要业余网络管理员敲 CLI(Command Line) 命令行进行配置,而云网络 API 和控制台,用户能够很轻松实现云网络搭建。

最初是按需付费。企业应用传统网络设备,即便利用率不到 30%,为了肯定的弹性,也只能超额购买,而云网络采纳按需付费,企业依据理论使用量进行免费,用多少付多少钱,这也是传统网络所不具备的。

云网络的倒退历程

云网络倒退经验三个阶段,2009 年的云网络 1.0,即云数据中心网络;2016 到 2020 年的云网络 2.0,是云广域网络,再到 2020 年开始的云网络 3.0,是利用 - 云边一体网络。在不同的阶段,云网络给用户提供了不同的产品能力,满足用户的网络需要。

云网络 1.0 是云数据中心网络,是为用户在云上提供构建数据中心网络的产品能力。用户能够通过点点鼠标,创立 VPC、虚构交换机、虚构路由器,构建数据中心网络环境,再通过 EIP,负载平衡 SLB,NAT 网关等产品实现互联网拜访。

云网络 2.0 的外围是云广域网络,用户在云上多地区部署业务零碎后,很天然的需要就是多地区内网互通,另外,用户还有云下 IDC 和云上 VPC 互通的需要,云广域网络能够很好的满足用户这两个业务场景的需要。2017 年,阿里云在业内率先公布云企业网 CEN,用户能够非常简单疾速的构建一张全球化网络。2018 年,阿里云还公布了云原生 SD-WAN 产品 - 智能接入网关 SAG,不便用户疾速上云。云网络 2.0 让用户轻松构建一张云上云下一体的寰球网络。

2020 年,5G/IoT/ 边缘计算技术的倒退,社会进入万物互联和产业互联网时代,云计算曾经成为整个数字社会的基础设施 云网络也开启了 3.0 时代。云网络作为数字化社会的高速公路,将会拓展到边缘,并和利用产生更好的协同,让万物互联,助力产业互联网的倒退。

基于云原生的洛神云网络技术

云网络因云而生,依云而建,第一天就采纳全自研的形式,走出了一条基于云原生特有的云网络技术之路。包含大规模 SDN 控制技术、Sailfish 软硬件一体转发技术、CyberStar 弹性网元技术等。

自研大规模 SDN 控制器,让用户不再放心规模和复杂度

SDN 控制器是规模和管理效率的要害。云原生趋势下,大量用户基于云应用 Docker 和 K8s,这对云网络的规模和密度提出了很大的挑战。SDN 控制器能够满足用户每 VPC 包容 100 万实例的超大规模需要,也能够满足用户对单个 ECS 的高密度弹性网卡需要。此外,在公共云大规模背景下,管理效率也十分要害。包含用户配置变更的实时性、易用性等,这些都是基于云原生构建的 SDN 控制器劣势所在,让用户不必再放心规模和复杂度问题。

自研软硬一体的 Sailfish 转发平台,让用户不再放心性能问题

Sailfish 硬件转发平台基于专用可编程芯片、智能网卡等高性能转发组件,通过软硬件一体架构设计,构建主机和根底网关高性能转发能力。包含软硬件一体高性能网关 XGW、MOC 卡、ALI-LB 等外围模块,目前广泛应用在云网络的各个场景。如下图所示:

XGW 网关负责公网、专线和跨 Region 流量的汇聚和散发。MOC 卡是服务器外部网络外围组件,负责服务器外部 ECS 流量的转发和替换。XGW 网关和 MOC 卡一起为客户搭建一张虚构专用网络。在这张虚构专用网络中,典型场景如下:

1)用户经 internet(公网)拜访阿里云,应用的典型产品有 EIP 和共享带宽;

2)用户 IDC 拜访阿里云,应用的典型产品有高速通道(专线);

3)云上跨地区通信,如北京地区 ECS 拜访深圳地区 ECS,典型产品有 CEN;

网络设备的演进始终呈螺旋式倒退态势,围绕着灵活性和高性能,软件和硬件在互相交融、相互促进。从最开始的硬件转发设施,到软件转发设施,再到目前硬件卸载的软硬一体化转发设施以及大行其道的可编程转发设施。灵活性和高性能就像一只有形的手,疏导着技术的继续倒退。

而在这方面,云计算服务商的驱动力更大,促使云网络的研发走在了业界的后面。以阿里云自研软硬件一体高性能网关 XGW 为例。有客户提出通过高速通道(专线)构建混合云,对专线带宽的需要是 10Tbps!如果采纳原有的 x86 服务器构建,即便采纳高性能服务器,思考肯定的冗余性,也须要近百台服务器,不论是老本还是经营效率都是服务承受的,这促使云网络研发出软硬件一体的高性能网关 XGW。

阿里云自研软硬件一体高性能网关 XGW

XGW 乍一看像一台 2U 的服务器,次要部件有负责大流量转发的 P4 可编程替换芯片,负责大表项转发的自研网卡芯片,负责业务编排和智能调度的 CPU 模块。目前单机能够反对 3.2Tbps,曾经在线上规模应用,让用户不必再放心性能问题。

CyberStar 弹性网元平台,让用户真正按需弹性,让投资更无效。

随着更多大型企业用户上云,用户对弹性的要求越来越高,特地是视频直播、电商大促等业务场景,常常提出突增百倍甚至千倍的弹性需要。此外,用户对新性能的交付工夫也有很高的冀望,平台也心愿能尽快满足用户需要。在这样的背景下,原有的基于 x86 服务器构建的技术架构就不能满足业务需要了。在电商大促场景,公共云用户泛滥,平台也不晓得到底多少用户会进行大促,一旦用户弹性需要呈现,须要用大量负载平衡 SLB,此时再去购买和部署 x86 服务器,扩容 SLB 集群就为时已晚。

因而,基于云原生的 ECS 构建弹性就是自然选择。CyberStar 弹性网元平台最大的特点是网元不再间接部署在裸金属服务器或专用计算资源池内,而是基于公共云上 ECS 部署,基于 ECS 构建意味着资源“有限”,弹性“有限”,让业务网元不再依赖传统 x86 物理服务器部署,解决了采纳物理服务器部署扩容长、弹性扩大艰难等问题。目前,CyberStar 弹性网元平台广泛应用在利用负载平衡 ALB,NAT 网关,PrivateLink,CEN-TR,寰球减速 GA,VPN 网关等外围产品。利用负载平衡 ALB 提供每实例 100 万 QPS 能力,并可“有限”弹性,真正做到让用户按需弹性。

将来瞻望

2020 年,IDC FutureScape 认为云专用设备化是一大趋势,IDC 预测到 2024 年,公共云上超过 25% 的新工作负载将应用服务商的专用基础架构组件。然而,在云网络畛域,这一趋势更快,应用软硬件一体技术研发的云原生的专用设备曾经成为云网络业务场景的支流,应用基于云原生的 ECS 构建的 CyberStar 弹性网元平台也正在大规模应用。

将来云网络技术会继续向这两个方向演进,依赖云原生构建技术架构,是云网络的外围劣势所在。云网络,依云而生,生而为云,是真正云原生的网络。(完)

阐明:本文为「凌云时刻」原创文章,转载请恪守转载要求,并务必保留作者和出处。

正文完
 0