关于人工智能:GPU底层技术全球市场格局分析3 - 乐趣区

1. 寰球 GPU 市场规模和各子市场趋势

2020 年寰球 GPU 市场价值预计为 254.1 亿美元，预计 2027 年将达到 1853.1 亿美元，年均匀增速为 32.82%。按 GPU 的类型进行划分，市场能够细分为独立、集成和混合。2019 年，集成 GPU 占 GPU 市场的主导地位，然而因为混合 GPU 同时领有集成和专用 GPU 的能力，所以混合细分市场预计实现最高复合增长率。

按 GPU 的设施进行划分，市场可细分为计算机、平板电脑、智能手机、游戏机、电视、其余。就支出而言，智能手机细分市场占比最大，在将来也将放弃这一趋势。然而，因为医疗等其余设施中对小型 GPU 的需要一直减少，预计将来的年复合增长率将最高。

按 GPU 的行业进行划分，市场可细分为电子、IT 与电信、国防与情报、媒体与娱乐、汽车、其余。因为 GPU 在设计和工程利用中的宽泛应用，预计汽车细分行业的年复合增长率最高。

按 GPU 的天文区域划分，市场可细分为北美、欧洲、亚太和其余地区。亚太地区在 2019 年主导了寰球 GPU 市场，预计在整个预测期内将放弃主导地位。

▲寰球 GPU 市场规模预测

▲2015-2025 寰球前三 GPU 供应商营收总和

2. 寰球 GPU 市场竞争格局

寰球 GPU 曾经进入了寡头垄断的格局。在传统 GPU 市场中，排名前三的 Nvidia、AMD、Intel 的营收简直能够代表整个 GPU 行业支出。英伟达的支出占 56%、AMD 占 26%、英特尔占 18%。

在手机和平板 GPU 方面，联发科、海思麒麟、三星 Exynos 的 GPU 设计次要基于公版 ARM MaliGPU 或 PowerVR 微架构。高通骁龙 Adreno 和苹果 A 系列采纳自研 GPU 微架构。

2019Q2，ARM、高通、苹果、Imagination 科技、英特尔是寰球智能手机和平板的前五大 GPU 供应商。同期 ARM Mali 在以上五大 GPU 供应商中占 43% 的市场份额，高通 Adreno 占 36% 的份额，苹果占 12% 的份额。

3. 寰球 GPU 龙头：英伟达

英伟达公司成立于 1993 年，于 1999 年率先推出“GPU”的图形解决方案。公司次要设计游戏和业余市场的 GPU，挪动计算和主动驾驶汽车的 SoC，是 GPU 计算畛域公认的寰球领导者。它次要的 GPU 产线“GeForce”和 AMD 的“Radeon”造成间接竞争。同时，英伟达为了拓展移动游戏平台，推出了掌机 Shield、Shield 平板、Shield 电视盒子和云游戏服务 GeForce Now。目前，公司曾经实现了由芯片供应商向计算平台的转型。

英伟达的四大增长驱动力别离是游戏业务、数据中心业务、业余视觉业务、主动驾驶业务，各业务的代表性 GPU 计划别离是 GeForce，DGX、EGX、HGX，Quadro、AGX。

英伟达 2021 财年营收 167 亿美元，其中游戏、数据中心、业余视觉、主动驾驶业务在 2020 财年别离奉献了营收的 47%、40%、6%、3%。公司继 2014 年毛利率冲破 50% 后，于 2021 财年毛利率冲破 60%。

英伟达的游戏业务：由 GeForce 和 Shield 组成。其中 Shield 面向挪动端和云，GeForce 面向 PC。游戏笔记本和云游戏是公司拓展市场的 2 大方向。GeForce 是英伟达游戏业务的外围。GeForce 是寰球最大的游戏平台，领有超过 2 亿名玩家。在 PC 游戏畛域，英伟达的营收是其余次要 GPU 供应商的三倍多。GeForce 曾经来到了 RTX30 系列，采纳第二代 NVIDIA RTX 架构 -NVIDIA 安培架构，搭载全新的 RT Core、Tensor Core 及流式多处理器，领有 RTX 游戏、DLSS、G-SYNC、DirectX12 等先进技术，可带来真切的光线追踪成果和先进的 AI 性能。

除了 PC 游戏市场，英伟达也向合作伙伴 – 任天堂 Switch 主机提供定制版 Tegra SoC。作为单干的一部分，Shield 主机能够畅享任天堂的游戏，GameStream 串流游戏和热门游戏，实现 4KHDR 画质，反对百度 DuerOS 对话式人工智能。

英伟达的数据中心业务的技术本源是 CUDA（对立计算设施架构）。CUDA 首次推出于 2006 年的 G80 外围，隶属于通用并行计算架构，发明了 GPGPU。在“安培”时代，CUDA 外围曾经进化到了 8.0，被使用在简直所有的英伟达产品线。

CUDA 兼容 DirectCompute、OpenCL 等计算接口。与 Direct3D、OpenGL 等高级图形 API 相比，CUDA 能够使开发者更容易应用 GPU 资源。以后，CUDA 在狭义上既代表 GPU 的硬件平台又代表 GPU 的软件平台。

在硬件平台方面，CUDA 蕴含了 CUDA 指令集以及 GPU 外部的并行计算引擎。GPU 平台的矢量运算如 INT、FP32、FP64 都由 CUDA 承当。开发人员能够应用 C 语言和 Fortran 语言为 CUDA 编写程序。

在软件平台方面，基于 CUDA 的 CUDA- X 减速库、工具和科技汇合，向上对接不同的行业利用需要。在英伟达的软件栈体系中，分为 CUDA-X AI 和 CUDA-X HPC，别离面向 AI 和 HPC 两大畛域，能够在人工智能和高性能计算方面提供远超其余竞品的性能。CUDA- X 的开发者曾经超过 100 万。

英伟达数据中心的产品包含实用于 AI 的 DGX 零碎，实用于边缘计算的 EGX 平台，实用于超算的 HGX 平台、实用于数据处理的 DPU、简化深度学习，机器学习，高性能计算的 NGC 目录。相干的 GPU 加速器有采纳安培架构的 A100、A40，采纳图灵架构的 T4、RTX6000、RTX8000，采纳伏特架构的 V100。

过来 5 个财年中，英伟达数据中心的营收从 8.3 亿美元回升至 66.96 亿美元，年复合增速 69%。同时，公司的注册开发者超过 200 万，与次要的云供应商如谷歌、腾讯、阿里建设了供给关系，世界 500 强超算中的份额从 6% 回升至 70%。

英伟达业余视觉业务次要由 Quadro 产品线组成。Quadro 在 GeForce 的根底上增强了 NVLink、GPU 的通用计算性能和显存容量，领有 Iray、Omniverse 平台、材质定义语言等特有技术。Quadro 被广泛应用在台式工作站、笔记本电脑、EGX 服务器、虚构工作空间、云端、定制化计划中。英伟达 Quadro 计划有超过 50 种利用、4000 万设计用户和 2000 万企业用户，并正在一直解锁新市场。

在过来的 5 个财年，英伟达业余视觉的营收从 8.35 亿美元回升至 10.53 亿美元，年复合增速 6%。

▲英伟达业余视觉 GPU 减速合作伙伴

英伟达的汽车产品包含相干驾驶软件、驾驶根底设计、AGX 平台，提供训练、模仿、智能驾驶舱体验、高清地图和定位等解决方案。在相对性能方面，搭载 4 颗 Drive AGX Origin 的蔚来 ADAM 超算平台反对 L4 以上主动驾驶，超过 7 个特斯拉 FSD 算力总和。

不同于特斯拉主动驾驶谋求软硬件的高度符合，英伟达的计划更谋求开放性。公司在汽车畛域的合作伙伴以软件服务和轿车居多，别离达到了 76 家和 42 家。同时，公司与公众、丰田、本田、飞驰、宝马、奥迪、沃尔沃、马牌、滴滴、采埃孚、蔚来、小鹏、图森等世界出名公司建设了强力的生态。

在过来的 5 个财年，英伟达主动驾驶的营收从 4.87 亿美元回升至 5.36 亿美元，年复合增速 3%。

英伟达并购 ARM：2020 年 9 月 13 日，NVIDIA 发表以 400 亿美元收买 ARM。本次收买意义能够细分为以下 5 个方面：

发明 AI 时代的世界级计算公司，将英伟达当先的 AI 计算平台和 ARM 宏大的 CPU 生态相结合；
通过英伟达在挪动端和 PC 等大型终端市场的科技拓展 ARM 的 IP 受权组合；
减速 ARM 的服务器 CPU、数据中心、边缘 AI、IoT 倒退；
将英伟达计算平台的开发者由 200 万晋升至超过 1500 万；
并购能够立刻减少英伟达的非 GAAP 毛利率和非 GAAP 每股收益；

合并后的英伟达将把计算从云、智能手机、PC、主动驾驶车和机器人技术推动到了边缘物联网，将 AI 计算拓展到寰球，在拓展大规模、高增长市场的同时减速翻新。

4. 寰球 GPU 先驱：AMD

AMD 是寰球惟一能够同时提供高性能 GPU 和 CPU 的企业。AMD 的显卡来源于 2006 年并购的 ATI 科技。在这之后的 4 年中，AMD 持续应用 ATI 作为显卡品牌。直到 2010 年，AMD 才摈弃原 ATI 的品牌命名形式。

目前，AMD 同时提供独立 GPU 和集成 GPU，其集成 GPU 次要使用在 Ryzen APU、嵌入式、半定制平台中，独立 GPU 分为 Radeon 和 Instinct 系列，次要用于游戏、业余视觉、服务器等利用。

过来六年，AMD 的计算和图形支出的营收由 18.05 亿美元回升至 64.32 亿美元，年复合增速 29%。

将来五年，AMD 打算成为高性能计算的领导者，提供颠覆性的 CPU 和 GPU 计划。

AMD 的集成 GPU 次要被使用在台式机和笔记本的 APU 产品中，和 CPU 组成异构运算单元。台式和笔记本 APU 的 GPU 部份共用微架构和核心技术，二者 GPU 的次要差别在于 TDP 和处理单元的数量，台式强于笔记本。

“Renior”APU 的 GPU 持续应用 Vega 微架构，但受害于 7 纳米制程，每个处理单元效力显著晋升。

7 纳米 Vega 的晋升包含：数据网络翻倍、优化低功耗状态转换、25% 主频晋升、77% 存储位宽晋升。这些晋升带来了在放弃 15W 功耗不变的前提下，每个计算单元 59% 的性能晋升、1.79TFLOPS 的 32 位浮点峰值吞吐。

在 3DMark Time Spy（DX12）的跑分中，7 纳米的 Ryzen 4800U 的 GPU 体现超过 10 纳米 i7-1065G7，是 14 纳米 i7-10710U 的 2 倍以上。

AMD 的 Radeon 系列游戏独立 GPU 按微架构推出工夫顺次递加能够分为 RX6000 系列、RX5000 系列、Radeon 7、RX500 系列。以上四大系列中，除 RX500 系列外均采纳台积电 7 纳米制程。

2020 年 11 月推出的 RDNA2 微架构相较于前代 RDNA 相对性能最高晋升一倍，能效进步 54%，反对 DirectX12 Ultimate，硬件光线追踪和可变速率着色器等先进技术。搭载 16GBGDDR6 显存和 128MB InfinityCache 高速缓存的 RX 6900XT 的游戏性能靠近英伟达的 RTX 3090。

为了施展 AMD CPU 和 GPU 的协同效应，Radeon 领有 AMD SmartAccess Memory 技术，锐龙 CPU 和显卡之间能实现更杰出的通信。RX6800 系列显卡在局部游戏中 4K 画质性能额定晋升最高可达 7%。

2022 年前，AMD 将基于更先进的制程打造 RDNA3 微架构，进一步强化光追等计算体现。

除了传统的 BGA 显存封装，AMD 还踊跃使用 HBM 系列显存。在 Radeon7 中，16GB 的 HBM2 显存领有 1TB/ S 的带宽，超过同期 Titan RTX 50%。

AMD 的数据中心 GPU 业务由 Radeon Instinct 加速器系列、以客户为外围的数据中心解决方案和 ROCm 组成。AMD 的次要合作伙伴包含戴尔、惠普等 OEM，同时 AMD 也向微软 AZURE 和亚马逊网络服务提供视觉云解决方案。

ROCm 是寰球首个针对减速式计算且不限定编程语言的超大规模开源平台，遵循 UNIX 的抉择哲学、极简主义以及针对 GPU 计算的模块化软件开发。

ROCm 适宜大规模计算，反对多路 GPU，有丰盛的零碎运行库，包含框架、库、编程模型、互联和 Linux Kernel 上游反对，提供各种重要性能来反对大规模利用、编译器和语言运行库的开发。

AMD 正与美国能源部、橡树岭国家实验室和 Cray 公司单干，应用 EPYC（霄龙）CPU、Radeon Instinct GPU 和 ROCm 打造超过 150 亿亿次 FLOPS 的寰球最快超算平台。

▲AMD ROCm 开源软件生态

Radeon Instinct MI 100 加速器采纳专一计算的 CDNA 微架构，在计算和连贯方面实现了微小飞跃，与 AMD 上一代加速器相比，高性能计算工作负载（FP32 矩阵）性能晋升近 3.5 倍，而人工智能工作负载（FP16）性能晋升近 7 倍。InstinctMI 100 在 FP32 和 FP64 的峰值 TFLOPS 中超过了同期英伟达安培 A100，同时功耗比后者低 100 瓦。

为了满足多路 GPU 的互联通信需要，AMD 研发了 InfinityFabric 技术。Infinity Fabric 领有先进的平台连接性和可拓展性，最多反对 4 路 GPU 互联。P2P 带宽是 PCIe 4.0 的 2 倍，四 GPU 集群的 P2P 带宽最高可达 552GB/s。

将来，AMD 将基于更先进的制程打造 CDNA2 微架构，进入百亿亿级时代。

AMD 的其余独立 GPU 次要包含嵌入式、半定制化、Radeon Pro 工作站显卡。半定制化独立显卡次要倍使用在索尼、微软的本世代和次世代主机中。现在，AMD 的技术存在于 2.2 亿个家庭畅享游戏和视频娱乐时所用设施的外围。

嵌入式 GPU 的特点包含卓越的图形性能、多屏显示、形状紧凑、高能效、长期供货。嵌入式 GPU 分为超高性能嵌入式 GPU、高性能嵌入式 GPU、高能效嵌入式 GPU，它们次要应用 14 纳米的 GCN 1.4 北极星微架构，TDP 笼罩 20W-135W 范畴。

Radeon Pro 系列显卡被广泛应用于建筑工程、设计制作、媒体娱乐等畛域，领有 AMD 近程工作站、AMD Eyefinity 多屏显示技术、AMD Radeon ProRender 等技术。Radeon Pro 系列采纳 Vega 微架构，7 或 14 纳米制程，间接竞争对手是英伟达的 Quadro 系列。Radeon Pro 挪动和台式工作站的合作伙伴包含苹果、戴尔、惠普等。

5. 英特尔：寰球 GPU 追赶者

英特尔是寰球最大的 PC GPU 供应商，也是 PC 和服务器显卡惟一的 IDM 厂商。英特尔的 GPU 最早能够追溯到 1998 年的 i740，然而因为羸弱的性能和迟缓的更新速度，始终没有十分大的起色。进入 Core i 时代后，英特尔通过将核芯显卡和 CPU 进行捆绑销售，利用 CPU 的宏大市场份额，确立了公司在集成 GPU 畛域的寡头垄断位置，在此过程中 AMD 的 APU 始终是酷睿的间接竞争对手。

2020 年，英特尔推出了第 12 代 GPGPU，采纳全新的 Xe 微架构和 10 纳米 Super Fin 制程。相较于第 11 代核显，Xe-LP 在放弃电压不变的前提下，大幅晋升主频，能效显著进步。搭载 Xe-LP 的 i7 1185G7 在 GPU 性能方面曾经超过同期 AMD 的 Vega 核显和英伟达的 MX 系列独显。

Xe 系列能够细分为，集成 / 低功耗的 Xe-LP、娱乐 / 游戏的 Xe-HPG、数据中心 / 高性能的 Xe-HP、高性能计算的 Xe-HPC。

目前，Xe-LP 的集成版本曾经被第 11 代酷睿所采纳。Xe-LP 的挪动独立 GPU 版本 DG1 和服务器独立 GPU 版本 SG1 也已公布。独显版在核显版的根底上进一步晋升主频，并退出了 128 位 4GB LPDDR4X-4266 独立显存，单精度浮点算力晋升 15%。

英特尔的集成 GPU 在模式上体现为核芯显卡。核芯显卡应用零碎 DRAM 作为非独立显存，通过处理器外部的环状总线与 CPU 连贯，负责解决游戏、视频娱乐等图像负载。

英特尔 Xe 核显借助 10 纳米 SuperFin 的劣势，将处理单元最高晋升至 96 个，相较于 Icelake 的 64 个晋升了 50%，并且将连贯 CPU 和 GPU 的总线带宽晋升一倍，独立最终缓存（LLC）进步 50%，反对最高 86GB/ s 的存储带宽。以上这些晋升使 i7-1185G7 的 3DMark 跑分较前代 i7-1065G7 晋升靠近一倍，超过 AMD 的 R74800U 和同期英伟达的 MX350。

Xe 核显的显示引擎和媒体引擎也都失去增强。接口方面，外部反对双 eDP，内部反对 DP1.4、HDMI2.0、雷电 4、USB4 Type-C。画质方面，反对 8K、HDR10、12 比特 BT2020 色域、360 赫兹刷新率等。

英特尔 Xe 外围显卡和 CPU 经由自家 One API 驱动中间层框架和下层利用。英特尔 One API 解决了编码模型在不同微架构间的壁垒，最大化跨平台体现和最小化开发成本。

目前，锐炬 Xe MAX 是第一款基于英特尔 Xe 架构的面向轻薄型笔记本电脑的 GPU。锐炬 Xe MAX 在 Xe 集成 GPU 的根底上减少了 4GBLPDDR4X-4266 的独立显存，TDP 25W，峰值主频 1650MHz，单精度浮点性能 2.46TFLOPs。锐炬 Xe MAX 能够和 11 代酷睿处理器、锐炬 Xe GPU 同时工作。借助英特尔 Deep Link 技术，取得具备弱小性能和通过功耗优化的集成系统，以改良创造力和游戏体验。

目前，英特尔服务器 GPU 在 Xe 核显的根底上，TDP 晋升到 23W，减少了 8GB LPDDR4 的独立显存，反对高密度、低提早的安卓云游戏和高密度媒体转码 / 编码，以实现实时的 OTT 视频直播。同时，英特尔服务器 GPU 反对 2 颗、4 颗独立 GPU 的聚合，成倍进步性能。

将来，英特尔还将推出面向游戏和高性能桌面的 Xe HPG 产品线，减少了光线追踪等硬件反对，采纳传统封装，外包生产。英特尔服务器 GPU 将应用 Xe HPC、Xe HP 微架构，采纳 2.5D 和 3D 先进封装，10 纳米 SuperFin 及更先进自家或外包工艺。

6.ARM Mali：寰球 GPU IP 巨头

ARM 是寰球最大的半导体 IP 提供商。全世界超过 95% 的智能手机和平板电脑都采纳 ARM 架构。2019Q2，寰球近 43% 的手机和平板 GPU 由 Mali 驱动。2020 第四季度，ARM 半导体合作伙伴基于 ARM 技术的芯片出货量达到 67 亿颗，再创历史新高，超过其余所有风行的 CPU 指令集架构—X86、ARC、Power、MIPS 的总和。

国产 SoC 中，有 95% 是基于 ARM 处理器技术，ARM 中国受权客户超过 150 家，基于 ARM 架构的国产芯片出货量曾经超过 184 亿。

ARM 的 Mali GPU 按性能能够分为 3 大类，别离是高性能、支流、高能效。

Arm Mali-G78 GPU 是用于高端设施的第二代基于 Valhall 架构的 GPU。Mali-G78 是性能最高的 ArmGPU，可反对简单的利用，例如实用于 Vulkan 和 OpenCL 等所有最新 API 的游戏图形和机器学习（ML）。

Mali-G78 与上一代设施相比，GPU 性能进步了 25%，并加强了设施上的 ML 性能，从而有助于将高度简单的游戏带入挪动设施。Mali-G78 最多反对 24 个内核，并蕴含异步顶级性能，可确保性能无效地散布在各个内核上，从而使图形运行更加晦涩。全新执行引擎中的新型交融乘加（FMA）单元可进一步升高 30% 的单元能耗。

在 GFXBench Aztec Ruin 的跑分中，应用台积电 5 纳米工艺，搭载 24 个 Mali-G78 内核的麒麟 9000 SoCGPU 的帧数强于骁龙 865 的 Adreno 650，但仍落后于苹果 A14。

7. 寰球 GPU 巨头：Imagination

Imagination Technologies 是一家总部在英国，专一于半导体和相干知识产权许可，销售 PowerVR 挪动图形处理器，MIPS 嵌入式微处理器和生产电子产品。公司还提供无线基带解决，网络，数字信号处理器，视频和音频硬件，IP 语音软件，云计算，以及芯片和零碎设计服务。2017 年，董事会发表公司被中资的 Canyon Bridge 收买。

Imagination 在 GPU 畛域历史悠久，在其超过 25 年的历史中，Imagination 先后推出过多代 GPU 产品，已积攒超过 1500 项 GPU 专利，曾为苹果供给图像处理器（GPU），在图像处理器（GPU）畛域与高通、ARM 三分天下，曾占 GPU 市场大概占据三分之一的份额，在汽车畛域更是达到 43%。带有 Imagination IP 的芯片产品累计出货量已超过 110 亿。

Imagination 的 IP 包含图形处理器和视觉与人工智能 2 类。公司 Power VR 产品被广泛应用于挪动设施（智能手机、平板）、汽车（仪表、信息娱乐、辅助驾驶）、沉迷式体验（AR/VR）、生产电子（电视、机顶盒）。

依据 Imagination 的 GPU 路线图，在 A 系列 GPU 性能最高晋升 2.5 倍之后，B 系列到 D 系列 GPU 的年复合增速在 30% 左右。2021 年的 C 系列 GPU 将首次退出 L4 级别的光线追踪，从硬件层面反对一致性分类的档次突围体（BVH）和简单光线解决，相比目前英伟达和 AMD 的 L3 级别光线追踪计划可显著晋升能效，实现更好的用户体验。

2020 年 10 月，Imagination 推出了全新的 IMG B 系列 GPU，这是公司第一个蕴含新多核架构的 GPU IP 系列，也是首次采纳 RISC-V，可提供最高的性能密度。得益于多核架构和 Imagination 图像压缩技（IMGIC），B 系列相比 A 系列，功耗升高 30%，带宽升高 35%、面积缩减 25%，AI 算力达到 24 TOPS，且填充率比竞品 IP 内核高 2.5 倍。与 A 系列类似，B 系列 GPU 也反对 AI 协同技术，在提供图形处理性能的同时，可用备用资源来解决可编程 AI 等工作。

IMG B 系列 GPU 共有 IMG BXE、IMG BXM、IMG BXT、IMG BXS 四种系列。其中 IMG BXE 面向高清显示利用，IMG BXM 主打图形处理体验，IMG BXT 面向高性能利用，IMG BXS 面向未来汽车。

BXS 系列合乎 ISO 26262 规范，也是迄今为止所开发的最先进汽车 GPU IP 内核。BXS 提供了一个残缺的产品系列，从入门到高端，可为下一代人机界面（HMI）、UI 显示、信息娱乐零碎、数字驾舱、盘绕视图提供解决方案。高计算能力的配置可反对主动驾驶和 ADAS。

凭借外围可扩大的劣势，IMG B 系列实用于传统挪动设施、消费类设施、物联网、微控制器、数字电视 (DTV) 和汽车等市场畛域。IMG B 系列也可扩大至桌面 GPU、云端 GPU 服务器，且反对主动驾驶和辅助驾驶等。

8、高通 Adreno：寰球挪动 GPU 先驱

高通的自研 GPU Adreno 源于收买的 AMD 挪动 GPU Imageon 系列。晚期的 Adreno 100 系列只有 2D 图形减速和无限的多媒体性能。2008 年公布的 Adreno 200 是首款被集成到骁龙 SoC 中的 GPU，并退出了 3D 硬件加速性能。

2020 年 12 月，高通推出了搭载 Adreno 660 的骁龙 888 SoC。Adreno 660 继承了 Adreno650 的微架构，采纳了三星 5 纳米 LPE 工艺，大幅提高主频，使图形渲染性能进步 35%，能效进步 20%。Adreno 660 全面反对 Qualcomm® Snapdragon Elite Gaming 和 Qualcomm® Game Quick Touch，二者将可变速率渲染和响应速度别离晋升 30% 和 20%。

在 GFXBench Aztec Ruin 1080P 测试中，Adreno 660 的峰值帧数追平麒麟 9000，但相较苹果 A14 仍有近 20% 的差距。

9、苹果：寰球挪动 GPU 新秀

苹果的自研 GPU 首次呈现于 2017 年的 A11 SoC。A11 的三外围 GPU 作为苹果的首款自研 GPU，其性能超过采纳 Power VR GT7600+ 的 A10 GPU 30%。其后，所有的 A 系列 SoC 的 GPU 均为苹果自研。

2020 年，苹果推出了 5 纳米制程的 M1 芯片，该款 SoC 基于 A14 芯片，在 CPU、GPU、NPU、缓存等各方面都进行了强化，用于驱动苹果的 Mac 产品。M1 芯片的公布标记着苹果继 2005 年放弃 IBM 的 PowerPC 指令集转向 Intel 的 X86 指令集后的又一大 PC 畛域转换。

采纳 8 核 GPU 的 M1 领有 128 个执行单元，能够同步运行近 25000 个线程，单精度浮点算力达到 2.6 TFLOPs。M1 GPU 的能效体现是过后同类 PC 中集成 GPU 的三倍，峰值性能最高可达其余 GPU 的 2 倍。

出品丨自主可控新鲜事

本文内容综合自方正证券、智货色等