乐趣区

关于边缘计算:构建面向异构算力的边缘计算云平台

1 月 6 日,“火山引擎产品技术大讲堂”2022 年首期直播在线开讲,围绕 ” 算力 ” 主题,探讨多样化的算力利用与实际。
边缘计算产品负责人沈建发作为收场嘉宾,分享了火山引擎边缘计算如何解决万物互联时代异构算力行业倒退及业务演进面临的挑战,揭秘边缘计算对立纳管异构算力,积淀的平台能力和典型的场景利用。

  1. 万物互联的智能时代
  2. 构建新一代边缘计算云平台
  3. 字节跳动场景利用
  4. 将来瞻望

01 万物互联的智能时代

技术倒退,从信息孤岛到万物互联

在正式进入异构算力的主题前,咱们来回顾一下从信息化到智能化的倒退过程。晚期业务状态次要解决单点问题,主机 / 单机计算出现信息孤岛的状态。随着 PC 端、挪动端技术的倒退,从人人互联,到人类既生产数据又生产数据,再缓缓到设施与设施之间的信息互联,万物互联的时代未然到来。

在万物互联时代,须要计算的数据越来越多,需要在一直的变动,异构计算可能充分发挥 CPU/GPU 在通用计算上的灵活性,及时响应数据处理需要,搭配上 FPGA/ASIC 等非凡能力,可充分发挥协处理器的效力,依据特定需要正当地调配计算资源,反对不同计算单元和场景。

业务倒退,从内容触达演进为体验触达

从业务倒退的角度来看,晚期更关注内容自身,到前面直接参与互动的交互性,再到当初身临其境的沉迷式体验,用户对内容的状态诉求也在一直演变。

举个例子,字节跳动在产品上也在一直变动和新陈代谢,从今日头条、抖音,再到当初波及到家装设计的住小帮,还有专一 VR 外围体验的 Pico。利用也从晚期的图文、点播,到实时音视频、直播还有 AR/VR 等。利用状态越来越丰盛,用户对体验的需要也越来越高。视频内容的互动提早需要从秒级进入到毫秒级,对交互性、沉迷式的体验也提出更高要求。

现阶段随着视频直播、实时音视频业务的全域笼罩,算力的需要也逐步多样化。从 CPU 到 CPU+GPU,再到不同算力的异构单元,海量洪峰对网络的冲击,须要将大量的网络流量卸载到硬件上做 Offload,来升高 CPU 耗费,进步解决性能。加上 AR/VR、3D 等视觉利用越来越多,就近渲染、网络、算力的需要逐渐浮现,算力多样化开始成为互联网时代的新需要。如何对立纳管异构算力,构建新一代的边缘计算云平台,是边缘计算团队亟待解决的问题之一。

02 构建新一代边缘计算云平台

火山引擎边缘计算:用户和云核心之间的所有算力层

提到边缘计算云平台,首先跟大家分享一下咱们对边缘计算的定义:咱们把从用户到云核心之间所有的算力层都定义为边缘计算。

  • 首先,“现场边缘 ”次要位于用户现场或用户本人的机房。 实践上次要笼罩 1~5ms 时延范畴。咱们能够将核心训练好的模型算法和能力下沉到用户的现场侧,满足超低延时的计算和网络能力。对应撑持异构算力的硬件设施有 x86/ARM、智能网卡、GPU、FPGA 等,利用场景次要是 AIoT、边缘时序数据等实时性业务。
  • 其次,“近场边缘 ”,次要位于全国二三四线城市或城区节点, 实践上次要笼罩 5~20ms 时延范畴。对应撑持异构算力的硬件设施有:x86/ARM、智能网卡、GPU 等。常见的业务场景有:CDN、视频直播、实时音视频、视频监控和图像处理等。
  • 最初,“云边缘 ”,位于区域核心城市、提供多线及 BGP 汇聚节点, 实践上次要笼罩 20-40ms 时延范畴 ,能够跟核心云实现高效连贯,为“现场边缘和近场边缘”提供汇聚能力,实现如:合并回源、并发解决等能力。对应撑持异构算力的硬件设施有:x86/ARM、智能网卡、GPU 等。 常见的业务场景有:CDN 合并回源,视频直播的 L2 层转发、离线渲染业务、数据并发解决业务等。

基于以上咱们构建了新一代边缘计算云平台。

新一代边缘计算云平台

通过采纳云原生架构,火山引擎边缘计算构建了新一代边缘计算云平台。边缘计算云平台整体采纳一横 N 纵的构造,一横是指基于边缘计算基础设施打造的云原生边缘平台,N 纵指具象化的服务能力,如边缘虚机、边缘容器、边缘网络、边缘函数和边缘渲染等。

  • 首先,在基础设施层,依据边缘算力的散布层级优选全国各省市丰盛的边缘资源和运营商网络,并按地理位置部署优质的复线、多线和 BGP 的节点,联合多种架构的硬件设施,如:x86、ARM 服务器、智能网卡、GPU、Tofino(P4) 等算力和网络资源,打造面向异构算力的边缘基础设施底座。
  • 其次,在平台层,基于边缘基础设施底座,火山引擎边缘计算自研了云原生边缘平台,以面向边缘云原生的操作系统为外围,提供边缘自治治理、外围零碎组件治理以及大规模部署的镜像服务能力。
  • 第三,在资源服务层,边缘计算团队将云原生边缘平台模块化,通过自研网络组件提供多种性能,由此造成边缘计算资源服务层,能够按需提供不同的边缘能力,如:虚机、容器、网络、函数、渲染等一系列服务。
  • 最初,边缘计算云平台配合云边治理和数据管理模式,实现业务的全域智能调度、实时数据大屏,满足内容散发、视频直播、实时音视频、云游戏等多个场景利用。

目前新一代边缘计算云平台已在字节跳动反对多个场景的业务利用。

03 字节跳动场景利用

实时音视频

首先,在实时音视频场景中。

随着视频会议、在线教育等场景的遍及,端到端之间实时互动的要求要越来越高。实时音视频能够借助边缘节点实现业务的就近接入,保障节点间低时延互联互通,提供高速稳固的实时音视频通信优质链路。

  • 边缘算力的弹性扩容能力能保障业务量突增时,视频会议中长会话的通信品质。
  • 边缘计算 GPU 实例还能够满足实时音视频中的渲染需要。
  • 高性能负载平衡能够反对实时音视频在边缘节点内高效货色转发,买通东西向流量。
  • 另外,多线、IPv4/ IPv6 双栈等也为实时音视频提供残缺的能力保障,满足多人连麦、多人视频会议的低时延需要。

边缘渲染

第二,在边缘渲染场景中。
在边缘渲染场景中,如常见的直播特效、家装利用波及的 3D 特效和 VR 看房等,在内容制作环节往往有大量的工程数据须要解决。边缘计算能够基于设计师所在地理位置就近提供服务,缩短工程数据传输间隔,无效升高网络时延,进步业务渲染的实时性。

  • 对于一个 1G 我的项目工程文件,生成 100 帧,每帧 300MB 图片的场景。核心上传下载须要 760 秒,边缘只须要 79 秒。边缘传输效率是核心的 9.62 倍。
  • 同时,通过全域节点的边缘算力资源和智能调度,能满足要害渲染工作的灵便切片,实现多节点并行渲染,晋升渲染效率,减速内容创作的渲染周期以及疾速公布工程作业。

云游戏

第三,在云游戏场景中。

云游戏场景中,用户对时延更加敏感。区别于端游、页游、手游和主机游戏,云游戏的游戏资源、运行、渲染都须要在云端实现,相当于用户在云端玩游戏。

云游戏业务依靠全域笼罩的边缘异构算力,基于用户地理位置的亲和性,通过边缘智能就近调度,实现游戏指令毫秒级交互。同时,联合高密度的 ARM 集群、GPU 算力、弹性扩缩容、资源隔离等性能,反对多个云游戏实例并发运行,为终端用户提供无设施限度、稳固、高品质、超低时延的游戏体验。

VR 场景

第四,在 VR 场景中。

VR 次要是通过 720 度的 3D 全景视频为用户提供更加沉迷式的体验。为了升高 VR 的视觉晕动症影响,须要为用户提供超高清、超低时延的 VR 视频服务,也就意味着更高的带宽需要和更快的服务响应。

在理论场景中,人眼可视角度是无限的,即咱们会重点关注以后可视画面的清晰度,周边区域及非可视区域画质对用户体验其实影响不大。通过边缘计算部署 VR 的媒体优化服务,可实时获取用户观看 VR 视频的头盔方向角度,从而计算用户的可视角度值,并以此智能抉择传输和渲染的实时画面,最终实现用户可视画面高清传输,周边画面压缩传输,充分利用无限带宽,实现更加高清的 8K/12K VR 画面,保障用户获取优质的沉迷式体验。

安卓原生云

第五,在安卓原生云场景中。

  • 云手机能够散布部署在边缘云的各个节点中,通过智能调度,能无效晋升用户互动体验,目前次要场景有云手游、云办公、云侧广告、IM 机器人等。
  • ARM 架构能够集成高性能显卡,并提供高效的图形图像转编码解决能力,联合智能调度和分布式边缘计算节点实现用户高效拜访和极致应用体验。
  • 同时,ARM 指令级兼容原生安卓云,通过智能调度满足用户就近接入需要,池化资源,升高用户应用门槛,除此之外还反对批量创立、批改、删除,升高经营 / 运维门槛。

边缘实时渲染成果比照

最初,咱们来看看手机端渲染和边缘端渲染的成果比照以及二者的区别。

以后很多渲染业务都是间接在用户现场通过硬件终端来实现的,比方常见的基于用户手机的渲染。随着业务的倒退,渲染的工程和品种对算力的需要越来越高。另外,用户终端的手机算力层级不同,常见的中低端手机很难满足相应的渲染算力需要,而用户对画质和特效的要求只增不减,因而咱们比照了基于 GAN 算法的漫画风全图特效。

能够看到,在手机渲染和边缘云渲染的效果图中,边缘云渲染的细节还原度和色阶平滑度比手机渲染要更平滑天然,二者存在视觉可见的显著差距。

另外,引入云渲染后的网络时延想必也是大家关注的问题之一。对此,咱们通过 RTC 将本地采集的视频数据传输至边缘计算节点进行渲染后返回,并在终端屏幕推送。右图能够看到,得益于 5G+ 边缘计算节点的低时延个性,最终测试的端到端时延在 100-150ms 左右。对于直播场景而言,这个时延是能够承受的,对于网络直播的用户来说,影响不显著,但却能够通过边缘实时渲染的形式帮忙利用实现更多乏味、沉迷式、创新性的玩法模式和更多的特效工程成果。

另外,引入云渲染后的网络时延想必也是大家关注的问题之一。对此,咱们通过 RTC 将本地采集的视频数据传输至边缘计算节点进行渲染后返回,并在终端屏幕推送。右图能够看到,得益于 5G+ 边缘计算节点的低时延个性,最终测试的端到端时延在 100-150ms 左右。对于直播场景而言,这个时延是能够承受的,对于网络直播的用户来说,影响不显著,但却能够通过边缘实时渲染的形式帮忙利用实现更多乏味、沉迷式、创新性的玩法模式和更多的特效工程成果。

04 将来瞻望

目前,基于新一代边缘计算云平台的首款产品“边缘计算节点”已正式公布,并在 CDN、视频直播、实时音视频、云游戏、AR/VR 等多个场景落地。将来,咱们也打算在智慧城市、工业互联网、智慧交通和影视行业摸索更多的利用场景,心愿携手各界合作伙伴一起,凋谢探讨边缘计算的更多可能性。让咱们一起边创将来。

退出移动版