关于gpu:轻量型-GPU-应用首选-京东智联云推出-NVIDIA-vGPU-实例

轻量型 GPU 利用首选京东智联云推出 NVIDIA vGPU 实例

在应用异构计算服务的场景中，“计算资源过剩”问题非常广泛。以云游戏为例，企业通常仅须要一颗物理GPU几分之一的计算能力即可晦涩实现图形或视觉计算。针对这类对算力需要较少的利用场景，轻量型异构计算产品则更为实用。

为了让用户能够用更细粒度的计算资源开启业务，京东智联云近期推出了基于NVDIA vGPU技术的虚拟化GPU实例，借助软件通过分片虚拟化技术将物理GPU卡从新划分，宰割后的vGPU具备相应划分比例的计算能力和显存，同一块GPU卡经虚拟化宰割后可调配至不同的云主机应用。用户在云上能够依据负载抉择算力匹配的实例规格，满足多种异构计算场景，升高云上GPU应用老本。

京东智联云推出的vGPU云主机实例蕴含C类型（Virtual Compute Server）和Q类型（Quadro vDWS）两款，均搭载NVIDIA® Tesla® P40，反对1/2、1/4、1/6 三种划分粒度，并提供多种CPU、内存配置组合，用户能够按需抉择适量的计算资源，晋升零碎灵活性，并大幅降低成本。

C类型vGPU实例次要面向AI、计算机学习和科学计算等场景，多实用于高校设计院、钻研机构等深度学习的教学和试验场景；Q类型vGPU实例次要面向影视行业的实时渲染、图形图像解决和修建工业设计等业余图像处理场景，可反对Maya、3DMAX、UG、BIM等专业级图形处理软件，满足用户对GPU在图形设计方面的需要。

▲C类型（Virtual Compute Server）vGPU实例规格▲

▲Q类型（Quadro vDWS）vGPU实例规格▲

在vGPU技术面世以前，云上GPU云主机大多采纳直通模式（GPU passthrough），直通模式下GPU绕过操作系统，作为物理设施间接提供给虚拟机应用，因为没有设施的模仿和转换过程因而性能损失极小，可能满足少数大规模并行计算场景。

然而，直通模式下受限于GPU卡的物理应用限度，单台云主机至多搭载一块GPU，物理服务器GPU的数量又决定了云主机CPU和内存的分配比例，如业务在少数运行工夫对GPU算力需要较少，会存在大量的计算资源节约。因而，GPU外围均匀使用率较低的轻量型GPU利用，非常适合选用vGPU规格主机来进行部署。

轻量型模型推理服务

深度学习场景下，在线推理所需的GPU资源往往少于离线训练，然而工作负载受线上业务影响会存在肯定稳定，顶峰期间会有大量并发。此类业务部署时能够依据工作负载抉择适合的vGPU规格主机作为集群的最小部署单元，以使得集群计算能力更贴合理论计算力需要曲线，进步GPU资源的使用率，优化老本。

教学、开发场景

高校及教学机构在发展AI相干课程时，须要提供搭载GPU的服务器作为根底教学实际环境，参加课程的人员钻研方向和业务水平各异，对GPU资源算力的需要也不尽相同，在云上依据教学工作按需申请不同规格的vGPU云主机和GPU云主机，既能满足各种场景下的资源需要，又能够节俭教学资源。

与物理GPU卡不同的是，NVIDIA vGPU面向不同的场景，提供四种类型产品。每种类型vGPU运行时须要相应的软件受权（License），对操作系统的要求也有所区别。

除此之外，不同类型的vGPU产品在诸多性能个性上也有所差别，具体阐明能够返回NVIDIA官网查阅（请戳链接 http://3.cn/15-k06ay）。

在受权形式上，vGPU云主机运行后会向事后配置的License Server服务器发动受权申请，胜利获取License后会以规范性能运行，如获取License失败将会在性能受限的模式下运行直至取得受权。vGPU云主机只有在运行时才会耗费License，主机进行或开释时，License会被License Server主动回收。

举荐浏览：

送你4句口诀云存储选型不再犯难
京东智联云新一代分布式数据库TIDB架构揭秘
比MySQL快839倍！揭开剖析型数据库JCHDB的神秘面纱

欢送点击【京东智联云】，理解开发者社区

更多精彩技术实际与独家干货解析

欢送关注【京东智联云开发者】公众号

关于gpu:轻量型-GPU-应用首选-京东智联云推出-NVIDIA-vGPU-实例

评论

发表回复取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

关于gpu:轻量型-GPU-应用首选-京东智联云推出-NVIDIA-vGPU-实例

评论

发表回复 取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

发表回复取消回复