乐趣区

关于深度学习:盘点GPU三大应用市场

一、游戏渲染场景,对 GPU 需要旺盛

IDC 数据显示,2020 年游戏 PC 和显示器的出货量同比增长 26.8%,达到 5500 万台。游戏笔记本电脑在 2020 年增长了创纪录的 26.9%。与 PC 并行,游戏显示器在 2020 年也达到了新的高度,与 2019 年相比增长了 77%以上,出货量达到了 1430 万台。

IDC 预计 2021 年游戏显示器的销量将首次超过游戏台式机。即便游戏台式机逐步受到青眼,游戏笔记本电脑的显示器连贯率一直进步也意味着游戏监控器市场的五年复合年增长率预计将超过 10%。IDC 预计 2025 年寰球销量达到 7290 万,复合年增长率为 5.8%。

游戏绘图是 GPU 的传统应用领域,为游戏开发者提供电影级画质的实时渲染;
GPU 并行计算的根底构造、能够执行海量数据计算;
GPU 访存速度快;
GPU 领有更高的浮点运算能力,对图形与媒体加工速度快;

挪动端 AI 芯片市场不止于智能手机,潜在市场还包含:智能手环 / 手表、VR/AR 眼镜等市场。

在边缘计算场景,AI 芯片次要承当推断工作,通过将终端设备上的传感器(麦克风阵列、摄像头等)收集的数据代入训练好的模型推理得出推断后果。因为边缘侧场景多种多样、各不相同,对于计算硬件的考量也不尽相同,对于算力和能耗等性能需求也有大有小。因而利用于边缘侧的计算芯片须要针对非凡场景进行针对性设计以实现最优的解决方案。

安防摄像头倒退经验了由模仿向数字化、数字化高清到当初的数字化智能方向的倒退,最新的智能摄像头除了实现简略的录、存性能外,还能够实现结构化图像数据分析。安防摄像头一天可产生 20GB 数据,若将全副数据回传到云数据中心将会对网络带宽和数据中心资源造成极大占用。

通过在摄像头终端、网络边缘侧加装 AI 芯片,实现对摄像头数据的本地化实时处理,通过结构化解决、要害信息提取,仅将带有要害信息的数据回传前方,将会大大降低网络传输带宽压力。

以后支流解决方案分为:前端摄像头设施内集成 AI 芯片和在边缘侧采取智能服务器级产品。

前端芯片在设计上须要均衡面积、功耗、老本、可靠性等问题,最好采取低功耗、低成本解决方案;边缘侧限度更少,能够采取可能进行更大规模数据处理工作的服务器级产品。

二、云端 GPU 应用

人工智能服务器通常搭载 GPU、FPGA、ASIC 等减速芯片,利用 CPU 与减速芯片的组合能够满足高吞吐量互联的需要,为自然语言解决、计算机视觉、语音交互等人工智能利用场景提供弱小的算力反对,曾经成为人工智能倒退的重要撑持力量相比于传统 CPU 服务器,在提供雷同算力状况下,GPU 服务器在老本、空间占用和能耗别离为传统计划的 1 /8、1/15 和 1 /8。

以后在云端场景下被最广泛应用的 AI 芯片是英伟达的 GPU,次要起因是:弱小的并行计算能力(相比 CPU)、通用性以及成熟的开发环境。2020 年寰球 AI 服务器市场规模为 122 亿美元,预计到 2025 年寰球 AI 智能服务器市场将达到 288 亿美元,5 年 CAGR 达到 18.8%。

在 AI 开发中,因为深度学习模型开发及部署须要弱小算力反对,须要专用的芯片及服务器反对。开发者如抉择自购 AI 服务器老本过高。通过云服务模式,采取按需租用超算核心计算资源可极大升高我的项目期初资本投入同时也省却了我的项目开发期间的硬件运维费用,实现资本配置效率的最大化晋升。

寰球主动驾驶迈入商用阶段,将来可期。IDC 最新公布的《寰球主动驾驶汽车预测报告(2020-2024)》数据显示,2024 年寰球 L1-L5 级主动驾驶汽车出货量预计将达到约 5425 万辆,2020 至 2024 年的年均复合增长率(CAGR)达到 18.3%;L1 和 L2 级主动驾驶在 2024 年的市场份额预计别离为 64.4% 和 34.0%。只管目前 L3-L5 级主动驾驶技术的利用具备开拓性意义,L1-L2 级主动驾驶将仍然是将来 5 年内带动寰球主动驾驶汽车出货量增长的最大细分市场。

我国汽车市场规模一直增长,主动驾驶由 L2 向 L3 过渡。中汽协数据显示,2021 年 1 - 3 月,中国品牌乘用车共销售 210.8 万辆,同比增长 81.5%,占乘用车销售总量的 41.5%,占有率比上年同期晋升 1.4 个百分点。2020 年 1 月份至 9 月份,L2 级智能网联乘用车销售量达 196 万辆,占乘用车总销量的 14.7%。

更有局部企业减速研发 L3 级主动驾驶车型,多地发展主动泊车、主动驾驶公交车、无人智能重卡等方面的示范利用。到 2025 年,我国 PA(局部主动驾驶)、CA(有条件主动驾驶)级智能网联汽车销量占当年汽车总销量比例超过 50%,C-V2X(以蜂窝通信为根底的挪动车联网)终端新车拆卸率达 50%。

随着传感器、车载处理器等产品的进一步欠缺,将会有更多 L3 级车型呈现。而 L4、L5 级主动驾驶预计将会率先在关闭园区中的商用车平台上实现利用落地,更宽泛的乘用车平台高级别主动驾驶,须要随同着技术、政策、基础设施建设的进一步欠缺,预计至多在 2025 年~2030 年当前才会呈现在个别路线上。

感知门路,短时解决海量数据。行车过程中依赖雷达等传感器对情理信息进行采集后,处理器每秒需实时数据解析几 G 量级数据,每秒能够产生超过 1G 的数据。对处理器的计算量要求较高。

主动布局,刹时反馈保障平安。解决剖析实时数据后,须要在毫秒的工夫精度下对行车门路、车速进行布局,保障行车过程平安,对处理器的计算速度要求较高。

兼具技术老本劣势,GPU 为主动驾驶畛域支流。

目前汽车电子控制系统是分布式 ECU 架构,不同的信息娱乐、车身、车辆静止和能源总成零碎及其细分性能别离由不同独立的 ECU 单元进行独立管制,局部低档车型上的 ECU 数量超过 100 个。

将来,汽车电子操控零碎将会进一步向着集中化、软硬件解耦及平台化方向倒退,汽车将会由对立的超算平台对传感器数据进行解决、交融、决策最终实现高级别的主动驾驶性能。

三、海内 GPU 巨头 Nvidia

Nvidia:四大产品线平台,游戏业务和,数据中心业务快速增长

游戏业务:GeForceGPU、云游戏平台及相干产品设施;
数据中心:包含 Telsa 系列的 GPU 产品、EGX&HGX&DGX 终端产品为数据中心加速器、边缘计算、AI 计算数据中心服务器 GraceCPU;
DPU:收买 Mellanox,踊跃布局数据中心存储、传输 DPU;
业余显示:Quadro 业余绘图工作站、RTX 图形处理器、vGPU 软件;
汽车:DRIVEAGX 为主动驾驶工作平台。
Q3FY2022 英伟达第三季度营收达 71.03 亿美元,同比增长 50%。净利润为 24.64 亿 0% 美元,同比增长 84%。其中游戏业务收入达 32.2 亿美元,较去年同期增长 42%;数据中心业务收入为 29.4 亿美元,同比增长 55%。业余可视化业务收入达 5.77 亿美元,同比增长 144%;主动驾驶业务收入达 1.35 亿美元,同比增长 8%。

Nvidia:GPU 架构每,两年降级一次

Nvidia:推出 CUDA 软件堆栈,建设软硬件一体化生态

GPU 通用计算方面的规范目前有 OpenCL、CUDA、AMDAPP、DirectCompute。其中 OpenCL、DirectCompute、AMDAPP(基于开放型规范 OpenCL 开发)是凋谢规范,CUDA 是公有规范。

2006 年,公司推出 CUDA 软件推展,推动 GPU 向通用计算转变,之后一直强化通用零碎生态构建。为开发者提供了丰盛的开发软件站 SDK、反对现有的大部分机器学习、深度学习开发框架。推出的 cuDNN、TensorRT、DeepStream 等优化的软件也为 GPU 通用计算提供减速。

Nvidia:强劲的游戏业务提供,稳固现金流

数据中心次要产品为 Tesla 系列。通过将不同类型的 GPU 加速器与 CPU、DDR 等硬件产品组合以及软件开发,推出面向高性能计算 HPC、人工智能 DGX、边缘计算 EGX 等硬件产品。

软件产品 NGC 用于 GPU 减速的云平台服务,减速应用深度学习框架;虚构 GPU 次要用于在虚拟机上经营 AI、深度学习和高性能计算。

Nvidia:数据中心业务继续,快速增长

2020 年 4 月,Nvidia70 亿美元实现对 Mellanox 的收买。造成 NvidiaGPU+MellanoxRDMA+NvidiaCUDA 整体解决方案,提供从人工智能计算到网络的端到端技术全堆栈产品。

受害于市场对公司新一代安培架构产品的需要,同时对话式 AI、举荐零碎等上游场景的训练模型部署的增多。22 财年 Q3,公司数据中心业务收入为 29.4 亿美元,同比增长 55%。

Nvidia:提供 CPU+GPU+DPU,整体计划

交融了 Mellanox 的计算推了 DPU 的产品。BlueFieldDPU 通过分流、减速和隔离各种高级网络、存储和平安服务,为云、数据中心或边缘等环境中的各种工作负载提供平安的减速基础设施。BlueFieldDPU 将计算能力、数据中心根底性能的可编程性及高性能网络相结合,可实现十分高的工作负载。

GPC2021 年推出了基于 ARM 架构的面向服务器市场的 CPU,用于大型计算中心或者超级计算机等场景中,通过 Nvlink 实现 CPU、GPU 之间的大带宽链接和交互。将来数据中心将具备 GPU+CPU+DPU 整体解决方案。

Nvidia:主动驾驶业务,步入收获期

公司造成了分层解耦、全栈式的主动驾驶计划。同时推出了主动驾驶配套的仿真零碎、底层开发平台、服务平台解决方案、主动驾驶性能计划和人机替换计划等,笼罩了硬件 + 软件的一体化解决方案,放慢上游客户主动驾驶计算的测试与开发。

Q3FY22 汽车业务收入为 1.35 亿美元,同比增长 8%,环比降落 11%。环比降落次要是受到汽车供应链缓和限度。

Nvidia:笼罩 L2/ 5 主动驾驶,利用场景

公司累计公布了 7 款主动驾驶芯片:TegraX1、TegraParker、TegraXavier、DriverXavier、DriveAGXOrin、Orin、Atlan 等。

公司公布 8 款主动驾驶计算平台,包含 DriverPX、DriverPX2、DriverPXXavier、DriverPXPegasus、DriverAGXXavier、DriberAGXPegasus、DriveOrin、PagasusRobotaxi。

随着 Xavier 和 Orin 主动驾驶计算平台的公布,公司新增笼罩 L2/ 3 级别的主动驾驶利用场景,目前曾经笼罩 L2-L5 级的主动驾驶的利用场景。

Nvidia:大算力芯片 + 计算平台 + 根底,软件构建主动驾驶平台

GTC2019 推出 NVIDIADRIVEAGXOrin,集成了 170 亿个晶体管并应用新的 NVIDIAGPU 和 12 核 ARMCPU,性能是上一代 Xavier 的 7 倍,将于 2022 年投入量产。

DRIVEAGXOrin 能够为从 L2 到 L5 的全自动驾驶开发提供兼容的架构平台。2021 年 4 月 13 日公布最新一代超算力芯片 Atlan,单芯片算力达 1,000TOPS,可满足 L5 需要,预计 2023 年提供样品。

领有齐备软件开发生态(操作系统 DriveOS+ 中间件 DriveWorks+ 软件堆栈 DriveAV),工具链稳固,凋谢水平高。

Nvidia:欲收买 Arm 翻新,服务器芯片生态

Nvidia 的 GPU 在数据中心和工作站中渲染图像和视频,Arm 凭借 Cortex 系列产品为 CPU 设计了蓝图,领有 Mali 的 GPU 系列。

一旦收买整合胜利 Arm 后,Nvidia 提供将 Arm 的 CPU 与其 GPU 技术集成的机会,创立一个生态系统的服务器芯片,除了数据中心还能够减速进入生产设施和汽车畛域,将在 2023 年提供 2500 亿美元的指标市场。

Nvidia:Omniverse,软硬件,技术的集大成者

Omniverse 蕴含 5 个重要组件:OmniverseConnect、Nucleus、Kit、Simulation 和 RTX。这些组件连同所连贯的第三方数字内容创作 (DCC) 工具,以及所连贯的其余 Omniverse 微服务,独特组成整个 Omniverse 生态系统。

OmniverseNucleus:Nucleus 是连贯不同位臵的用户,实现 3D 资产交互和场景描的数据库引擎。连贯当前,负责建模、布局、着色、动画、照明、特效或渲染工作的设计师,能够合作创立场景。Connect 被作为插件散发,使客户端应用程序能够连贯到 Nucleus。Kit 是一个用于构建原生 Omniverse 利用和微服务的工具包。

起源:本文整顿【驭势资本】

退出移动版