共计 1049 个字符,预计需要花费 3 分钟才能阅读完成。
文 / 尚旭春
Intel Sapphire Rapids(简称 SPR) 即第四代至强可扩大处理器,是 Intel 承前启后的一代产品。新引入加强指令、硬件加速器、AMX 矩阵计算、SGX 秘密计算、Scalable IOV、PCIe 5.0、CXL1.1 协定,涵盖了计算、平安、I/O 及虚拟化方面的泛滥技术升级和加强。
龙蜥社区对 Intel 平台的反对始终当先于业界,紧随 Intel 研发节奏,基于 Intel Arch SIG 第一工夫实现对 SPR 产品全面的反对,助力龙蜥用户以开箱即用的形式,享受新技术个性,整体反对状况如下图:
以上个性均在龙蜥社区失去全面反对:
加速器层面,Anolis 5.10 内核曾经反对 DSA、IAA,配合龙蜥社区提供的 accel-config 用户态工具,用户能够对这两个加速器进行疾速配置并使能。对于 QAT 和 DLB,其驱动曾经以 OOT 的模式公布于龙蜥社区,用户只需下载安装对应的 rpm 包即可享受新硬件加速带来的性能晋升。
平安层面,龙蜥社区曾经集成 SGX 的 SDK/PSW/DCAP 软件栈,并以 rpm 包模式公布,用户能够通过 Anolis 零碎便捷部署本人的秘密计算计划。
虚拟化层面,Anolis 内核率先反对 SIOV 个性,用户不论是应用 SPR 平台自带的硬件加速器,还是反对 SIOV 的第三方硬件,抑或是 DWQ/SWQ 的部署模式,都能够无感应用,真正做到了 One for All。
以下以对 AMX 指令的反对为例,介绍一下基于 Anolis 内核构建业务计划所带来的微小性能晋升:
Anolis 通过反对 AMX 指令并对其进行深层次的优化,搭建如图所示基于 Anolis 内核的深度学习计划,实测表明:
- 相较于 AVX512 INT8,Anolis-AMX-INT8 带来 8 倍整型性能晋升。
- 相较于 AVX512 BF16,Anolis-AMX-BF16 能够带来 16 倍浮点性能晋升。
能够看到,基于 Anolis 搭配 AMX 技术能够极大晋升 AI 业务能力。这只是 Anolis OS 对 SPR 进行垂直优化的一个简略示例,更多惊喜能够拜访龙蜥官网查看。目前 SPR 平台曾经上市,欢送宽广用户下载安装 Anolis OS,丝滑体验新平台 SPR!
Intel Arch SIG 主页:https://openanolis.cn/sig/Intel-Kernel
龙蜥官网:https://openanolis.cn/download
附:
2022 龙蜥社区全景白皮书(或公众号回复关键字“白皮书”获取)
https://openanolis.cn/openanoliswhitepaper
—— 完 ——