共计 6800 个字符,预计需要花费 17 分钟才能阅读完成。
购买新的图形卡(GPU)可能很艰难,尤其是如果波及您所不相熟的所有技术问题。
显卡市场上的大多数消费者只须要理解显卡在本人喜爱的游戏中的性能,并确定购买决定即可。然而,如果您想购买 GPU 进行视频编辑或 3D 渲染,则查找相干信息要艰难得多。
特地是对于 3D 渲染,如果您尽可能快地进行渲染,则会节俭大量工夫和金钱。
怎么辨别渲染 GPU 与编辑 GPU?
尤其是如果您不相熟图形技术,那么您就有很多问题须要答复。
咱们将在这里假如根本相熟水平,即,您晓得 GPU 代表图形处理单元,而图形卡是蕴含一个或多个 GPU 的扩展卡。
图像起源:Nvidia
有什么不同?业余 GPU 与消费者 GPU
现在,消费者 GPU 和业余 GPU 看起来比以往任何时候都更类似。
一些 GPU 甚至略微含糊了界线,例如 AMD 的 Radeon VII 或 Nvidia 的 Titan 系列。
毕竟,这些卡具备超高的价格标签和空幻的 VRAM 数量。
明天,让咱们看一下 Nvidia RTX GPU。面向消费者的 GeForce RTX 卡与面向业余的 Quadro RTX 卡之间有什么区别?
图片起源:PNY
它们都应用雷同的硬件体系结构,有时甚至能够指定为解决内核和 VRAM,然而 Quadro 的价格要高出好几倍……这仅仅是骗局吗?
让咱们来看看:
业余 GPU
消费类 GPU 与业余 GPU 之间的最大区别在于软件。
Nvidia 的 Quadro 卡和 AMD 的 FirePro 卡通过优化,专门针对高端生产力应用程序,与业界当先的应用程序具备极其彻底的兼容性。
此外,它们失去了多年的反对,并且被视为长期投资,而消费类图形卡则不被视为长期投资。
Pro GPU 已通过行业应用程序进行了测试,并且对驱动程序进行了优化,以使其施展最佳性能。许多高级行业应用程序(例如风行的 CAD 应用程序 Solidworks)具备非凡性能(例如 Solidworks 中的 RealView),只有在领有业余 GPU 的状况下才受反对。
例如,下图显示了 Solidworks 官网反对的 Nvidia GPU:
图像起源:Solidworks
如果您应用的是业余 GPU,则某些软件供应商仅反对您,并提供售后保护。
对于大型公司而言,这是至关重要的,在大型公司中,服务器或工作站的失常运行工夫对于放弃其低廉的员工始终在功能性 PC 上工作至关重要。
这的确是有情理的。有足够资金的公司购买 Quadro GPU。软件开发人员以足够的资金反对公司。这些公司通常还领有专门的 IT 人员,具备足够的专业知识。
怎么让麻烦更少,更无效:
1、Solidworks 反对人员与公司的 IT 专家交谈,而后能够解决公司所有 PC 上的某些 Solidworks 故障
2、许多 Solidworks 反对人员与数百名不理解 PC / Tech / IT 的个人用户交谈
购买 Pro-GPU 时,您购买的是 Pro-Support。(除了一些硬件性能)
消费类 GPU
消费类 GPU 将非常适合 游戏和消费类应用程序。
它们还能够十分擅长于 照片 和视频编辑,而功能强大的消费类 GPU(例如 Nvidia RTX 2080Ti)通常被夸张了。
消费类 GPU 也非常适合 GPU 渲染,因为 GPU 渲染引擎通常不具备只能在业余 GPU 上运行的性能。
业余 GPU,不过,通常会 … 不太善于的游戏,但高超的编辑,渲染和简直任何其它专业级的工作,然而,雷同的性能下,业余 GPU 会价格更高。
因而,如果您晓得抉择的软件没有应用须要业余 GPU 的性能,并且您不须要业余 GPU 中的大量 VRAM,那么消费类 GPU 简直总是更好的抉择,尤其是在性价比方面。
然而,让咱们深入探讨一些细节。
CUDA 内核,或者为什么在这里 Nvidia 受到青眼
CUDA 内核是指 Nvidia GPU 内发现的 非凡解决内核,这是 Nvidia 专有的。
CUDA 代表 Compute Unified Device Architecture,而 Nvidia GPU 外部的这些外围实质上是充当原始计算能力,而不是原始图形能力。
这就是为什么它们被用来在受反对的字幕(例如 Nvidia HairWorks)中加强计算密集型成果的起因,仅 GPU 不足以实现这项工作。
对于编辑和渲染,CUDA 外围是执行给定工作所需的额定计算能力的必不可少的起源。
大多数编辑和渲染应用程序都以某种形式进行了优化,以利用 CUDA 内核,因而在零碎中增加更多功能将使您可能更好,更快地渲染模型、视频等。
一些风行的 GPU 渲染引擎(例如 Octane 和 Redshift)是基于 Nvidia 的 CUDA 构建的,这意味着只有领有 Nvidia GPU 能力应用它们。在此类渲染引擎中,渲染性能简直与 GPU 具备的 CUDA Cores 数量成线性比例关系。
某些应用程序(例如 Adobe 的 After Effects 或 Premiere Pro)带来了对 Nvidia 和 AMD GPU 的反对,但通常在 Nvidia GPU 上运行得更快。
GeForce 还是 Quadro?
当波及到编辑视频和原始 3D 应用程序性能之类的事件时,GeForce 将为您带来最大的价值。
然而,因为 GeForce 是一个次要面向游戏玩家和一般消费者的品牌,因而高端专业人士可能须要短少某些性能。
Quadro 能够在许多应用程序中提供高性能,然而吸引人的要点是其对企业用户的软件反对。
与 GeForce 相比,任何取得的性能都要付出昂扬的价格。
然而,如果您须要ECC(纠错代码存储器)或相对适宜业余应用程序的最佳驱动程序,则 Quadro 是最佳抉择~
GeForce 专一于游戏和消费者,Quadro 专一于企业和企业用户。
此外,Quadro 还将具备更高的 CUDA 内核和 VRAM 数量,并且有时还会具备诸如 ECC 之类的独有性能,咱们将在稍后具体阐明。
总体而言,咱们向以下用户举荐 Quadro:
- 能够冲销高价作为业务费用
- 能够利用 ECC,更大的 VRAM,更高的浮点精度,更高的监视器位深度
- 须要仅专业级 GPU 反对的非凡软件性能(例如 Solidworks,Autocad…)
- 定期依附软件供应商的保护和反对
- 须要对其硬件进行全面测试,以确保其在企业或服务器环境中的持久性和稳定性,即便在 24/ 7 失常运行工夫下
咱们向以下用户举荐 GeForce:
- 不要利用仅 PRO 级 GPU 反对的性能
- 想要更多的钱来赚钱
- 不肯定须要大量的 VRAM 或 ECC
- 不要依赖其应用程序供应商的惯例软件反对
- 可能还想时不时地玩游戏
我须要 RTX 吗?
Nvidia 的“Turing”架构是第一个引入 RTX 的 架构,它在 CUDA 内核(即RT 和 Tensor 内核)之上带来了一些新性能。
图像起源:Nvidia
RT 内核是用于光线跟踪的,并且是专门为它而构建的。
对于业余渲染,至多在受反对的应用程序中,领有更弱小的光线跟踪 GPU 能够大大放慢工作量。
如果您不须要光线跟踪 GPU(尤其是如果您专一于视频编辑而不是 3D 渲染),那么 RT 内核的呈现就不会带来很大的不同。
Tensor 外围是另一个故事,变得更加乏味。
在 消费类 GPU 中,Tensor 内核用于实现 DLSS(深度学习超级采样)等性能,该性能应用 AI 来改善图像品质。
对于 业余用处,Tensor 内核能够利用其弱小的 FP16 / FP32 和 INT4 / 8 性能,使其成为神经网络、深度学习、人工智能等的现实抉择。
如果这些畛域听起来像您的企业想要摸索的货色,那么 Quadro RTX 可能就是您想要的。
至多在受反对的渲染引擎中,RT Core 还可大大提高渲染速度。例如,Octane 和 Redshift 正在钻研应用 RayTracing Cores 的实现。
总之,RT 和 Tensor 内核增加了一些丑陋的额定性能,这些性能可能会或可能不会对您的工作量产生影响。
然而,咱们依然倡议将 RTX GPU 替换为上一代 Nvidia GPU,因为即便不利用这些额定的解决内核,最新的 RTX GPU 的确比非 RTX 前辈具备显着的性能晋升。
编辑 GPU 须要什么?
与业余渲染相比,视频编辑 须要的 GPU 需要要少得多。
甚至您的 具备 CUDA 内核的 Nvidia 的根本消费类 GPU 都能够在这里实现工作,尤其是当您只是一个从事自由职业或公布到 YouTube 等网站的内容创建者时。
查看以下 Premiere Pro 视频编辑基准,能够分明地显示 GPU Sweet Spot 所在的地位:
视频和照片编辑不须要任何想象力,就不须要夸大的 Quadro GPU 规格和价格标签,因而您将非常适合 低端或中端 GeForce RTX GPU。
如果您的需要是更多企业级的(即 4K / 8K HDR 视频),那么您可能心愿抉择高端 GeForce RTX GPU。
您须要渲染 GPU 有什么性能?
从渲染 GPU(在业余环境中进行显式 3D 渲染),您将须要 GPU 的更多帮忙。
渲染 GPU(鉴于它与您正在应用的渲染引擎兼容)所须要的最大性能就是尽可能多的 CUDA 外围和 VRAM。
在 GPU 上渲染均匀帧所破费的工夫与 GPU 领有的 CUDA 外围数量 简直成线性正比。
然而,如果 3D 场景数据适宜其 VRAM(GPU 上的视频内存),则 GPU只能利用其微小的 CUDA Core 性能。
这意味着,如果您晓得具备数百万个多边形,子多边形位移或诸如大型纹理之类的非常复杂的场景,则 对 VRAM 的需要将比仅蕴含几个对象的场景相当简略的状况要高得多。
大多数 GeForce RTX GPU 曾经具备相当数量的 VRAM,通常在 8GB 至 11GB 之间,然而如果您须要更多,则必须应用 Quadro RTX GPU,它具备高达 48GB 的 VRAM。
在 Quadro GPU 中,您还将取得ECC,咱们当初将对其进行解释。
ECC:它是什么,以及为什么您须要它
ECC 是指 纠错代码存储器。
ECC 内存可检测并纠正在长期的高强度工作负载过程中天然产生的数据谬误。
这些谬误是造成 看似随机的事件(如数据损坏或系统故障)的起因,在解决足够软弱的数据时,必须不惜一切代价防止这些谬误。
这就是为什么 ECC 最罕用于服务器和企业 PC 中的 起因 - 为了避免这些谬误在造成最重大侵害时产生。
在 GPU 中,ECC 是 Nvidia 和 AMD 的业余 GPU 独有的。
在 Nvidia 的状况下,这些仅在 Nvidia Quadro GPU 中存在,并且对于避免某些状况下的致命谬误是必须的。
然而,大多数未集成到企业工作流中的消费者和创建者 能够释怀地疏忽 ECC。
评估体现
评估给定 GPU 性能的第一个也是最好的办法是查看基准。
通常,消费者会查看游戏和其余应用程序的基准,以最好地理解给定组件的性能。
通常,这里也实用雷同的观点,然而您的确须要晓得应该关注哪些基准。
为了进行 GPU 渲染,您具备受欢迎的 GPU 渲染引擎(例如OctaneBench,Redshift 和 VRAY -RT)的基准。
其余资源也可能会有所帮忙,包含 Passmark 的 GPU 计算基准表(用于掂量 DirectCompute / OpenCL 性能)。
除了基准测试外,还有外围规格,咱们将在以下每个精选下列出这些规格。
咱们要解决的外围规格是:
- CUDA 外围——对应于原始解决能力(3D 渲染性能的微小指标)
- Tensor 外围——对应于深度学习 / AI 性能以及 FP32 / 16 工作负载
- RT 外围——对应于光线追踪性能,能够成为受反对的渲染引擎中 3D 渲染的加速器
- VRAM ——用于治理较大的场景,编辑等,而不会占用过多的内存
- GPU 频率——GPU 外围速度的度量
顶级 GeForce 和顶级 RTX GPU 规格表
留神:理论价格可能有所不同。Quadro RTX 卡通常比 MSRP 便宜得多,而非 Quadro 卡通常比 MSRP 更高或更低。
从表中能够看出,最大的硬件差别归结为大幅晋升的 VRAM(带有 ECC),以及显着晋升了 CUDA,Tensor 和 RT 内核,至多在高端方面如此。
除了蕴含 ECC 外,Titan RTX 还提供与高端 Quadro RTX 卡相似的规格。
要害要点:
在 GeForce 上抉择 Quadro 的次要起因是为了加强稳定性以及对企业级软件的驱动程序反对–否则,GeForce 卡在许多状况下都能够以更低的价格取得类似的性能。
我应该用双 GPU 吗?
如果您要构建 游戏零碎 ,咱们的答案将非常简单: 不,相对不是。
在游戏方面,多 GPU 反对已大大减少,不倡议应用。
然而为了进步生产力……嗯,这是另一回事了。
游戏须要利用 SLI 之类的规范来利用多个 GPU 渲染一个场景,而大多数编辑和渲染应用程序都是 在思考分布式工作负载的状况下进行的。
这意味着您不仅不须要 GPU 完满协调地工作就能够同时领有两张卡,而且还能够看到 线性的 2 倍性能晋升,从而能够在工作负载中减少另一个 GPU!
双 GPU 并不是高端产品。随着在兼容零碎中增加更多卡,工作负载(如3D-GPU 渲染)的性能简直呈线性增长,对于 3D-Artists,装备多达 4 个 GPU 的 HEDT PC 是很常见的。
对于 Nvidia 的 NVLINK 的一小段内容:
然而,要利用 NVLINK 内存共享,您将须要比 RTX 2070 Super 更高层的 GPU。此外,应用 NVLINK 一次不能在两个以上的 GPU 之间共享内存,并且须要渲染引擎反对能力应用这些性能。
您将须要 NVLINK 桥来连贯两张卡。
在 Adobe Premiere Pro 中用于视频编辑的双 / 多 GPU 设置?
Premiere Pro 不会在零碎中应用多个 GPU,因而您不会从多个 GPU 中受害。
最佳编辑和渲染图形卡:瑞云的举荐抉择
1、最佳价值编辑和渲染 GPU:Nvidia RTX 2060 Super
参数:
- CUDA 外围– 2176
- Tensor Cores – 272
- RT 内核– 34
- VRAM – 8GB GDDR6
- GPU 频率– 1470 MHz(根本)
如果您估算无限,但仍心愿在花钱进行编辑和渲染工作时取得良好的性能,则RTX 2060 Super 将是咱们的首选。
与同价位的其余 GPU 相比,它为游戏和业余工作提供了全面的卓越性能。(不过,对于游戏而言,AMD RX 5700 相对是更好的抉择。)
RTX 2060 Super 具备适量的 RT 和 Tensor 外围以及相当数量的 CUDA 外围,足以编辑 1080p 和 1440p 视频。
在 OctaneBench 中,该卡的得分约为 205,这比 Quadro RTX 3000(在 149)和 Quadro RTX 5000(在 184)要好得多。
这意味着 2060 Super 可用的原始计算能力甚至超过 价格比其价格高出数倍的Quadro RTX 卡,这当然还不错。
这些问题使 RTX 2060 Super 在计算性能上稳居单个 GPU 卡的中端。
对于那些刚开始进行编辑和渲染的人,或者还没有数千美元的硬件投资,RX 2060 Super 是一个现实的终点。
须要双 GPU?取而代之的是鼓风机格调的 RTX 2060 Super
2、最佳高端编辑和渲染 GPU:Nvidia RTX 3090
参数:
- CUDA 外围——10496
- Tensor Cores——328
- RT 外围——82
- VRAM——24GB GDDR6X 9
- GPU 频率——1400 MHz(根本)
如果您估算不紧,又不须要 ECC,又不想卖肾脏来买显卡,请购买 Nvidia RTX 3090。
出于游戏目标,与低端同类产品相比,RTX 3090 并没有真正进步每美元的性能。
然而,与上述非 Ti 同类产品相比,它的 原始计算性能 的确有了 显着进步,这使其成为“编辑和渲染”中更具吸引力的抉择。
在 OctaneBench 中,RTX 3090 得分为 661,就单 GPU 性能而言,它巩固位置于高端单 GPU 卡上。
思考到所有这些因素,RTX 3090 成为了该级别的首选。如果您要解决 1440p / 4K 视频或惯例的高要求渲染工作,则 3090 是最适宜该工作的显卡之一。
3、最佳高端业余 GPU:Nvidia Quadro RTX 6000
参数:
- CUDA 外围——4608
- Tensor Cores——575
- RT 外围——72
- VRAM——24 GB GDDR6(ECC)
- GPU 频率——1440 MHz(根本)
最初但同样重要的是,让咱们看一下 Quadros。
在原始性能方面,在受 VRAM 限度的场景之外,Quadro RTX 6000 不会比 RTX 2080 Ti 更好。
这在 OctaneBench 中 失去了反映,该结果显示 2080 Ti 的 302 仅 308 英寸——难以置信的边际差别。然而,如果您已浏览该文章,则可能曾经弄明确了那局部。
取得 Quadro RTX 卡的次要动机是 加强的软件反对,稳定性和 ECC RAM 反对。
如果您想要在这个性价比范畴内的产品,但 Quadro RTX 6000 不能提供您所须要的产品,请思考以下三种抉择。
如果此卡看起来有点受 VRAM 的限度,请抉择Quadro RTX8000。大多数规格雷同,但 VRAM 却减少了一倍。
非 VRAM 绑定计划中的性能差别十分无限。
如果 ECC 对您的工作负载无关紧要,那么您也能够便宜得多,并取得具备简直雷同规格的Nvidia Titan RTX。
如果 ECC 不要紧,你的工作量和你不介意多付大概在同一价格,还要思考泰坦 V 。
它没有 RT 内核,然而它的确具备足够的计算 能力——依据 OctaneBench 的说法,是所有单个 GPU 中最好的——并且它依然具备更多的 Tensor 和 CUDA 内核能够应用。不过,它的确具备更少的 VRAM。