共计 1674 个字符,预计需要花费 5 分钟才能阅读完成。
轻量型 GPU 利用首选 京东智联云推出 NVIDIA vGPU 实例
在应用异构计算服务的场景中,“计算资源过剩”问题非常广泛。以云游戏为例,企业通常仅须要一颗物理 GPU 几分之一的计算能力即可晦涩实现图形或视觉计算。针对这类对算力需要较少的利用场景,轻量型异构计算产品则更为实用。
为了让用户能够用更细粒度的计算资源开启业务,京东智联云近期推出了基于 NVDIA vGPU 技术的虚拟化 GPU 实例,借助软件通过分片虚拟化技术将物理 GPU 卡从新划分,宰割后的 vGPU 具备相应划分比例的计算能力和显存,同一块 GPU 卡经虚拟化宰割后可调配至不同的云主机应用。用户在云上能够依据负载抉择算力匹配的实例规格,满足多种异构计算场景,升高云上 GPU 应用老本。
京东智联云推出的 vGPU 云主机实例蕴含 C 类型(Virtual Compute Server)和 Q 类型(Quadro vDWS)两款,均 搭载 NVIDIA® Tesla® P40,反对 1 /2、1/4、1/6 三种划分粒度,并提供多种 CPU、内存配置组合,用户能够按需抉择适量的计算资源,晋升零碎灵活性,并大幅降低成本。
C 类型 vGPU 实例次要面向 AI、计算机学习和科学计算等场景,多实用于高校设计院、钻研机构等深度学习的教学和试验场景;Q 类型 vGPU 实例次要面向影视行业的实时渲染、图形图像解决和修建工业设计等业余图像处理场景,可反对 Maya、3DMAX、UG、BIM 等专业级图形处理软件,满足用户对 GPU 在图形设计方面的需要。
▲C 类型(Virtual Compute Server)vGPU 实例规格▲
▲Q 类型(Quadro vDWS)vGPU 实例规格▲
在 vGPU 技术面世以前,云上 GPU 云主机大多采纳直通模式(GPU passthrough),直通模式下 GPU 绕过操作系统,作为物理设施间接提供给虚拟机应用,因为没有设施的模仿和转换过程因而性能损失极小,可能满足少数大规模并行计算场景。
然而,直通模式下受限于 GPU 卡的物理应用限度,单台云主机至多搭载一块 GPU,物理服务器 GPU 的数量又决定了云主机 CPU 和内存的分配比例,如业务在少数运行工夫对 GPU 算力需要较少,会存在大量的计算资源节约。因而,GPU 外围均匀使用率较低的轻量型 GPU 利用,非常适合选用 vGPU 规格主机来进行部署。
- 轻量型模型推理服务
深度学习场景下,在线推理所需的 GPU 资源往往少于离线训练,然而工作负载受线上业务影响会存在肯定稳定,顶峰期间会有大量并发。此类业务部署时能够依据工作负载抉择适合的 vGPU 规格主机作为集群的最小部署单元,以使得集群计算能力更贴合理论计算力需要曲线,进步 GPU 资源的使用率,优化老本。
- 教学、开发场景
高校及教学机构在发展 AI 相干课程时,须要提供搭载 GPU 的服务器作为根底教学实际环境,参加课程的人员钻研方向和业务水平各异,对 GPU 资源算力的需要也不尽相同,在云上依据教学工作按需申请不同规格的 vGPU 云主机和 GPU 云主机,既能满足各种场景下的资源需要,又能够节俭教学资源。
与物理 GPU 卡不同的是,NVIDIA vGPU 面向不同的场景,提供四种类型产品。每种类型 vGPU 运行时须要相应的软件受权(License),对操作系统的要求也有所区别。
除此之外,不同类型的 vGPU 产品在诸多性能个性上也有所差别,具体阐明能够返回NVIDIA 官网查阅(请戳链接 http://3.cn/15-k06ay)。
在受权形式上,vGPU 云主机运行后会向事后配置的 License Server 服务器发动受权申请,胜利获取 License 后会以规范性能运行,如获取 License 失败将会在性能受限的模式下运行直至取得受权。vGPU 云主机只有在运行时才会耗费 License,主机进行或开释时,License 会被 License Server 主动回收。
举荐浏览:
- 送你 4 句口诀 云存储选型不再犯难
- 京东智联云新一代分布式数据库 TIDB 架构揭秘
- 比 MySQL 快 839 倍!揭开剖析型数据库 JCHDB 的神秘面纱
欢送点击【京东智联云】,理解开发者社区
更多精彩技术实际与独家干货解析
欢送关注【京东智联云开发者】公众号