共计 1834 个字符,预计需要花费 5 分钟才能阅读完成。
9 月 2 日, 第二届 SmartNIC&DPU 技术创新峰会在北京召开。本次大会由江苏省将来网络翻新研究院和 SDNLAB 联结行业技术先锋力量、产业典型利用企业独特发动, 围绕 SmartNIC/DPU 技术创新、产业利用等问题开展研究与交换。大会现场还公布了 2022 SmartNIC & DPU Awards 年度评比后果, 天翼云 DPU 云核为根底打造的全新云计算体系结构荣获匠芯技术奖。
在 SmartNIC&DPU 技术分会场, 天翼云科技有限公司资深研发专家刘禄仁分享了天翼云 DPU 技术的研发与实践经验。他示意, 天翼云作为国内当先的云服务商, 基于以后 DPU 技术演进路线, 联合需要的零散化、动态变化以及对 DPU 产品线上运维问题的考量, 以 FPGA+CPU 的架构作为切入点, 胜利研发出天翼云 DPU1.0 产品, 并以自研 DPU 云核为根底打造了为云而生的全新云计算体系结构。
以后, 摩尔定律的放缓与寰球数据量暴发之间的矛盾正在迅速激化。IDC 数据显示, 寰球数据量在过来 10 年年均复合增长率靠近 50%, 并进一步预测每四个月对于算力的需要就会翻一倍。与此绝对的是, 传统的数据中心架构难以满足大规模的算力需要,CPU 性能每年仅晋升 3%, 造成了显著的“剪刀差”景象。在 CPU 无奈满足宏大算力需要的背景下,DPU 应运而生。
DPU 作为计算负载的引擎, 间接成果是给 CPU“减负”, 可能进步数据中心的运算效率, 缩小能耗节约, 进而降低成本, 在数字时代具备微小的商业价值与发展潜力。天翼云 DPU1.0 实现了虚拟化的零损耗, 具备高性能、低提早、低抖动的个性, 网络转发性能高达 4000 万 PPS, 存储云盘 IOPS 能够达到 60W。此外, 天翼云 DPU1.0 通过将传统运行在主机侧的利用转到 DPU 云核上, 缩小大量的适配工作, 在主机不同算力核和不同架构上可做到即插即用。
此外, 从产品的研发到落地, 天翼云 DPU 团队在网络、存储及 RDMA 方面也积攒了丰盛的实践经验。
在网络卸载方面, 针对流表数量大、转发性能要求高、对 SoC 和 FPGA 的内存容量需要大、稳定性要求低等挑战, 天翼云对 rte_flow 等次要数据结构进行压缩, 并对流表地面计算, 优化裁剪 offload 卸载门路的多层级缓存, 从而反对 4M 流表, 实现了内存优化; 对所有流表进行合并计算, 防止在硬件层执行包重注, 使转发效率达到 4000 万 PPS; 基于硬件准确流表特点设计专用老化统计线程, 加重 OVS Revalidator 压力; 初步拆分 OVS 的统计和老化事务逻辑, 优化硬件流表的老化统计上报实现逻辑, 晋升软件 OVS Revalidator 执行效率; 反对热降级、热迁徙及热复原, 做到 B /V/ C 全场景的并池, 大幅晋升稳定性。
在存储卸载方面, 针对经常出现的 SoC 异样重启、SPDK 异样重启、热迁徙丢 IO 等景象, 天翼云从中形象出独特个性, 利用软件协同的思维, 将 SoC 侧软件的失常行为和异样行为进行对立, 组件启动时对立发送 msg 信息给硬件, 硬件收到该 msg 会解析其内容, 进而从硬件保留的 queue 指针信息进行剖析, 在用户无感状态下实现全副异样的统一化解决。
在高性能网络方面, 拥塞算法是 RDMA 的外围和要害, 为进步 RDMA 网络的性能, 天翼云聚焦下一代高效 CC 算法设计, 以更好地防止拥塞、保障公平性, 实现更疾速收敛、更低时延、更简略部署。针对不同利用场景, 天翼云设计了 2 套算法 eSurfing-CC: 针对智能网卡 + 商用交换机的组合, 提出基于 RTT+CNP 的 2 段式端到端 CC 算法, 具备被动拥塞管制、无需依赖交换机的配置、反对疾速启动疾速收敛等劣势; 针对智能网卡 + 可编程交换机的组网场景, 天翼云在交换机上部署 CC 算法, 使交换机同样具备被动拥塞告诉能力和被动发包能力, 能够无效升高端到端响应时延, 同时简化建模和配置复杂度, 进步零碎的可扩展性。
目前, 基于天翼云 DPU 核心技术打造的多款产品已落地利用, 以天翼云弹性裸金属服务器为例, 该服务器兼具云服务器弹性和物理机性能, 通过将网络、存储等性能卸载至 DPU 卡, 可极大升高物理机侧 CPU 和内存等资源耗费, 最终算力远超一般云主机, 现已服务于金融、汽车等多行业企业。
随着 5G 时代数据量和传输速度的飞速增长, 国内厂商争相进入 DPU 赛道。依据 Canalys Cloud Channels Analysis 预测, 到 2023 年, 中国 DPU 市场规模将达 190 亿人民币。能够预感, 在数据中心流量一直加大的状况下,DPU 帮忙数据中心晋升算力、降低成本与能耗的同时, 将有更大的施展空间和广大的发展前景。