近日,阿里云杨敬宇在 CSDN 阿里云核心技术竞争力在线峰会上进行了《5G 基础设施 - 阿里云边缘计算的技术演进之路》主题演讲,针对 5G 时代下,行业和技术的趋势、边缘计算产业通识以及阿里云边缘计算从过去到未来的技术演进之路进行分享。
5G+AI 需求推动边缘计算不断向前 算力分布形态发生根本变化
回顾历史,自从 1994 年接入互联网,已经有 20 多年的时间,从应用场景看,终端从 PC 时代走到了移动时代,也包括电视、摄像头、IoT 等终端。而背后的基础设施也从早期的自建服务器,到当前全站上云这种模式。整体看来,网络架构是云、端两层架构。
当 5G 来临,消费互联网逐渐向产业互联网延伸,物联网、工业互联网、车联网、医疗健康、在线教育、企业远程视频会议等大带宽、低时延、大流量的场景被激活,原有的云、端两层网络架构很难满足新的产业互联网之下对低时延、低成本以及本地化计算的需求,这就促成了边缘计算出现的第一波应用。与此同时,5G 的一个关键特性是,与 2G、3G、4G 的管道形式不同,5G 允许在基站或者网络中的任何位置进行分流,所以 5G 也为边缘计算提供了技术上的可行性。以上两点,是边缘计算在 5G 时代走上风口的最核心原因。
在云、端两层网络架构中,计算要么发生是在云上,要么在手机、PC、电视机等终端上面,随着 IoT 万物智联的普及,工业互联网、车联网、智能家居、智慧城市、自动驾驶、云办公、3D 视频等新型的产业应用出现之后,全部的计算发生在云端可能无法满足时延要求,而全部发生在端侧,对端的要求又比较高。
所以,计算从原本的云端两层结构,逐渐迁移到基站以上和云以下的位置,在城市这样的位置实现距离与效率的平衡,演变成云、边、端三层结构,这将是未来主流的计算分布形态。
杨敬宇:2020 年是划时代的一年,是从消费互联网走向产业互联网的转折之年,也是边缘计算领域真正乘风而行的一年,期待 5G 边缘计算能够规模商用和真正落地。
边缘计算行业通识:技术架构、产业协同与应用场景
前面也提到,5G 原生支持在通信管道内分流做边缘计算,技术上具备了计算下沉到基站的可能性。也就是,在 4G 之前,在通信网络中一头是端,一头是云。如果把通信网络比作一条高速公路,它是没有服务区的,所有的信息流都是从这条高速公路上流转运行。5G 有一个非常好的特性,就是允许在高速公路上修建服务区,当信息在基站的位置,就可以把它分流出来进行本地计算,可以在社区网格、街道乡镇、地市区县、省会城市等等整个通信网络的任何一个位置实现计算。
在场景方面,未来沉浸式消费计算和产业互联网会涌现大量的“低时延高可靠 / 大带宽 / 大连接,低成本,属地化”等边缘计算需求。未来 5G 边缘计算有一些产业应用会大量的涌现。同时,终端的计算上云,比如云游戏、云桌面等应用场景,不管是对用户的成本,还是企业和设备的成本与维护来讲,都是最佳的状态。
边缘计算产业上下游有众多参与者,主要包括运营商、云厂商、专业服务厂商以及设备和芯片商等,分别从各自的优势来为边缘计算产业发展提供助力。
云厂商一直提供一种按需付费的云服务,随着产业互联网的到来,云厂商会结合边缘计算将云服务进一步延伸和拓展,大型、集中的计算还是交由云中心来完成,对于时延、成本、本地化计算有强需求的则放在边缘来完成。于运营商来讲,边缘计算是在运营商的城域网或 5G 核心网、基站等位置去计算,计算就发生在运营商的整个网络体系里面,无论是国外还是国内的三大运营商,目前对边缘计算的投入都是非常大的。而专业服务厂商包括一些 CDN 厂商,他原来定义的计算其实是放在地级市这种 IDC 之中,还不是严格意义上的通信互联网的边缘,同样也是一种边缘。另外,边缘计算之中有一部分是设备,比如在网关领域做边缘计算,这就涉及到了设备商和芯片厂商的领域了。
现阶段边缘计算的应用场景大约分两大类,一类是需要在全国各地,甚至全球各地去部署这种分布式计算资源,典型应用就是 CDN 内容分发网络,它其实就是在分布式节点上去提供内容缓存与转发。未来在线教育、在线会议和其他场景也是分布式互联网应用的核心场景。另外一类就是产业应用,对计算有本地化、低时延的诉求,可能在 10 公里、百公里范围内就要完成计算,比如视频汇聚、智慧园区等等场景。
边缘节点服务:开放、标准、灵活、易用的边缘云操作系统
谈到公共云与边缘云的区别以及边缘云的主要技术特征和挑战,杨敬宇认为主要有四点。
第一,公共云与边缘云都是大规模,但是规模属性不同。公共云是中心式的大规模的云,通常由少量的大资源去构成,而边缘计算通常是由大量的小节点组成。同时,从技术上来讲,公共云的整个的保障体系、机房、电力、网络环境和边缘云所处环境是不太一样的,所以边缘云与公共云的建设、资产管理逻辑都有所不同,这也是它非常大的一个挑战。
第二,边缘云并不是每 1 个小节点是一朵云,杨敬宇所认为的边缘云,是上万个节点或者上百万的节点组成的一朵云。所以边缘云是需要基于不可靠互联网的形成集中管理、统一调度的,甚至当边缘节点出现网络中断的时候还能够脱网自治。
第三,边缘计算要承接物联网、车联网各种各样的网络连接需求,所以边缘计算要解决如何去做 5G 网络分流的问题,包括计算什么样的流量需要分流,分流计算完之后又该怎样录流,它不是简单的提供一个计算服务,而是要云网一体的去提供给客户去使用。
第四,从客户的使用方法上来讲,以往公共云大家习惯的方式是:买一个 region、几台机器,还有一个 IP,就会知道它在哪里。但是边缘计算如果沿用这样的形式其实是可能会是一个灾难。
杨敬宇做了个恰当的比喻:实际上,使用边缘计算就应该像我们使用电话一样,当电话的时候我一定会使用一个 4G 或一个基站,甚至当开车的时候,手机连着基站还是会不断发生变化,但是作为使用者并不会关心基站在什么位置,我只是享受了打电话这个服务,我希望服务对我而言是无感的。所以,对于这种大规模边缘计算基础设施来讲,不是简单地去卖用户一个一个节点的计算能力,而需要考虑如何提供给用户一个在体验上更加无缝、在成本上有极大帮助的这么一套计算体系。我们一直将 ENS 比喻成一个操作系统,操作系统它的特点就是我的应用程序是基于进程、线程来使用 CPU 和内存,用户不用关心这个程序到底在 CPU 的哪个核上以及它用哪个时间片去计算。所以,ENS 操作系统要做的就是算力的管理以及算力的无缝使用,这是比公共云更难处理的一部分。
如上图所右侧示,阿里云 ENS 最底层仍然是各种各样的基础设施,基于这个基础设施以及阿里云的虚拟化、以及在网络计算存储安全方面的技术沉淀,在上面形成一个大规模、分布式的未知未知无感的、屏蔽底下资源差异、规模差异和使用差异的一个边缘云操作系统或者边缘计算平台。通过能力的开放以及运维联动,为上层应用提供了一套更便于使用的基础设施。
阿里云是从 2017 年开始进行技术上的打磨,并且基于遍布全球的 CDN 节点去改造为边缘计算节点,经过 2 年的发展,在 2019 年时,阿里云边缘计算其实做到了中国 300 多个地级市的全域覆盖,将计算的时延控制在 10 毫秒以内。也就是当用户去看视频,可能 25 帧的视频需要播放 40 毫秒,那么 10 毫秒就会让用户的视觉上毫无换帧的感知,对于云游戏、云桌面等应用,可以在时延上得到极大的满足。
边缘计算的概念近几年十分火热,但是各家在理解定义上,包括所实现的技术栈上,还是存在一定的差距。为了边缘计算行业积极良性的发展,阿里云在行业标准化方面也投入了大量的精力。2018 年 12 月,阿里云牵头发布了边缘云白皮书,在行业内首次定义了边缘云计算的概念。在 2019 年 9 月的云栖大会上,阿里云联合 20 多家单位对边缘云计算的通用技术要求标准进行发布,同时在 12 月份,阿里云也获得了由中国电子技术标准化研究院颁发的首批《边缘云标准符合性测试证书》,也意味着阿里云在推进边缘云领域标准化建设上更进一步。
杨敬宇认为:阿里云边缘计算是要构建城市计算,也就是以地级市为单位的去逐渐部署边缘云基础设施,为阿里巴巴经济体与行业客户的各类应用落实到边缘云提供助力,去赋能 5G 时代万物智联的智慧城市生活更快来临。