9月2日,第二届SmartNIC&DPU技术创新峰会在北京召开。本次大会由江苏省将来网络翻新研究院和SDNLAB联结行业技术先锋力量、产业典型利用企业独特发动,围绕SmartNIC/DPU技术创新、产业利用等问题开展研究与交换。大会现场还公布了2022 SmartNIC & DPU Awards年度评比后果,天翼云DPU云核为根底打造的全新云计算体系结构荣获匠芯技术奖。

在SmartNIC&DPU技术分会场,天翼云科技有限公司资深研发专家刘禄仁分享了天翼云DPU技术的研发与实践经验。他示意,天翼云作为国内当先的云服务商,基于以后DPU技术演进路线,联合需要的零散化、动态变化以及对DPU产品线上运维问题的考量,以FPGA+CPU的架构作为切入点,胜利研发出天翼云DPU1.0产品,并以自研DPU云核为根底打造了为云而生的全新云计算体系结构。

以后,摩尔定律的放缓与寰球数据量暴发之间的矛盾正在迅速激化。IDC数据显示,寰球数据量在过来10年年均复合增长率靠近50%,并进一步预测每四个月对于算力的需要就会翻一倍。与此绝对的是,传统的数据中心架构难以满足大规模的算力需要,CPU性能每年仅晋升3%,造成了显著的“剪刀差”景象。在CPU无奈满足宏大算力需要的背景下,DPU应运而生。

DPU作为计算负载的引擎,间接成果是给CPU“减负”,可能进步数据中心的运算效率,缩小能耗节约,进而降低成本,在数字时代具备微小的商业价值与发展潜力。天翼云DPU1.0实现了虚拟化的零损耗,具备高性能、低提早、低抖动的个性,网络转发性能高达4000万PPS,存储云盘IOPS能够达到60W。此外,天翼云DPU1.0通过将传统运行在主机侧的利用转到DPU云核上,缩小大量的适配工作,在主机不同算力核和不同架构上可做到即插即用。

此外,从产品的研发到落地,天翼云DPU团队在网络、存储及RDMA方面也积攒了丰盛的实践经验。

在网络卸载方面,针对流表数量大、转发性能要求高、对SoC和FPGA的内存容量需要大、稳定性要求低等挑战,天翼云对rte_flow等次要数据结构进行压缩,并对流表地面计算,优化裁剪offload卸载门路的多层级缓存,从而反对4M流表,实现了内存优化;对所有流表进行合并计算,防止在硬件层执行包重注,使转发效率达到4000万PPS;基于硬件准确流表特点设计专用老化统计线程,加重OVS Revalidator压力;初步拆分OVS的统计和老化事务逻辑,优化硬件流表的老化统计上报实现逻辑,晋升软件OVS Revalidator执行效率;反对热降级、热迁徙及热复原,做到B/V/C全场景的并池,大幅晋升稳定性。

在存储卸载方面,针对经常出现的SoC异样重启、SPDK异样重启、热迁徙丢IO等景象,天翼云从中形象出独特个性,利用软件协同的思维,将SoC侧软件的失常行为和异样行为进行对立,组件启动时对立发送msg信息给硬件,硬件收到该msg会解析其内容,进而从硬件保留的queue指针信息进行剖析,在用户无感状态下实现全副异样的统一化解决。

在高性能网络方面,拥塞算法是RDMA的外围和要害,为进步RDMA网络的性能,天翼云聚焦下一代高效CC算法设计,以更好地防止拥塞、保障公平性,实现更疾速收敛、更低时延、更简略部署。针对不同利用场景,天翼云设计了2套算法eSurfing-CC: 针对智能网卡+商用交换机的组合,提出基于RTT+CNP的2段式端到端CC算法,具备被动拥塞管制、无需依赖交换机的配置、反对疾速启动疾速收敛等劣势;针对智能网卡+可编程交换机的组网场景,天翼云在交换机上部署CC算法,使交换机同样具备被动拥塞告诉能力和被动发包能力,能够无效升高端到端响应时延,同时简化建模和配置复杂度,进步零碎的可扩展性。

目前,基于天翼云DPU核心技术打造的多款产品已落地利用,以天翼云弹性裸金属服务器为例,该服务器兼具云服务器弹性和物理机性能,通过将网络、存储等性能卸载至DPU卡,可极大升高物理机侧CPU和内存等资源耗费,最终算力远超一般云主机,现已服务于金融、汽车等多行业企业。

随着5G时代数据量和传输速度的飞速增长,国内厂商争相进入DPU赛道。依据Canalys Cloud Channels Analysis预测,到2023年,中国DPU市场规模将达190亿人民币。能够预感,在数据中心流量一直加大的状况下,DPU帮忙数据中心晋升算力、降低成本与能耗的同时,将有更大的施展空间和广大的发展前景。