购买新的图形卡(GPU)可能很艰难,尤其是如果波及您所不相熟的所有技术问题。
显卡市场上的大多数消费者只须要理解显卡在本人喜爱的游戏中的性能,并确定购买决定即可。然而,如果您想购买GPU进行视频编辑或3D渲染,则查找相干信息要艰难得多。
特地是对于3D渲染,如果您尽可能快地进行渲染,则会节俭大量工夫和金钱。
怎么辨别渲染GPU与编辑GPU?
尤其是如果您不相熟图形技术,那么您就有很多问题须要答复。
咱们将在这里假如根本相熟水平,即,您晓得GPU代表图形处理单元 ,而图形卡是蕴含一个或多个GPU的扩展卡。
图像起源:Nvidia
有什么不同?业余GPU与消费者GPU
现在,消费者GPU和业余GPU看起来比以往任何时候都更类似。
一些GPU甚至略微含糊了界线,例如AMD的Radeon VII或Nvidia的Titan系列。
毕竟,这些卡具备超高的价格标签和空幻的VRAM数量。
明天,让咱们看一下Nvidia RTX GPU。面向消费者的GeForce RTX卡与面向业余的Quadro RTX卡之间有什么区别?
图片起源:PNY
它们都应用雷同的硬件体系结构,有时甚至能够指定为解决内核和VRAM,然而Quadro的价格要高出好几倍……这仅仅是骗局吗?
让咱们来看看:
业余GPU
消费类GPU与业余GPU之间的最大区别在于软件。
Nvidia的Quadro卡和AMD的FirePro卡通过优化,专门针对高端生产力应用程序,与业界当先的应用程序具备极其彻底的兼容性。
此外,它们失去了多年的反对,并且被视为长期投资,而消费类图形卡则不被视为长期投资。
Pro GPU已通过行业应用程序进行了测试,并且对驱动程序进行了优化,以使其施展最佳性能。许多高级行业应用程序(例如风行的CAD应用程序Solidworks)具备非凡性能(例如Solidworks中的RealView),只有在领有业余GPU的状况下才受反对。
例如,下图显示了Solidworks官网反对的Nvidia GPU:
图像起源:Solidworks
如果您应用的是业余GPU,则某些软件供应商仅反对您,并提供售后保护。
对于大型公司而言,这是至关重要的,在大型公司中,服务器或工作站的失常运行工夫对于放弃其低廉的员工始终在功能性PC上工作至关重要。
这的确是有情理的。有足够资金的公司购买Quadro GPU。软件开发人员以足够的资金反对公司。这些公司通常还领有专门的IT人员,具备足够的专业知识。
怎么让麻烦更少,更无效:
1、Solidworks反对人员与公司的IT专家交谈,而后能够解决公司所有PC上的某些Solidworks故障
2、许多Solidworks反对人员与数百名不理解PC / Tech / IT的个人用户交谈
购买Pro-GPU时,您购买的是Pro-Support。(除了一些硬件性能)
消费类GPU
消费类GPU将非常适合游戏和消费类应用程序。
它们还能够十分擅长于照片和视频编辑,而功能强大的消费类GPU(例如Nvidia RTX 2080Ti)通常被夸张了。
消费类GPU也非常适合GPU渲染,因为GPU渲染引擎通常不具备只能在业余GPU上运行的性能。
业余GPU,不过,通常会...不太善于的游戏,但高超的编辑,渲染和简直任何其它专业级的工作,然而,雷同的性能下,业余GPU会价格更高。
因而,如果您晓得抉择的软件没有应用须要业余GPU的性能,并且您不须要业余GPU中的大量VRAM,那么消费类GPU简直总是更好的抉择,尤其是在性价比方面。
然而,让咱们深入探讨一些细节。
CUDA内核,或者为什么在这里Nvidia受到青眼
CUDA内核是指Nvidia GPU内发现的非凡解决内核,这是Nvidia专有的。
CUDA代表Compute Unified Device Architecture,而Nvidia GPU外部的这些外围实质上是充当原始计算能力,而不是原始图形能力。
这就是为什么它们被用来在受反对的字幕(例如Nvidia HairWorks)中加强计算密集型成果的起因,仅GPU不足以实现这项工作。
对于编辑和渲染,CUDA外围是执行给定工作所需的额定计算能力的必不可少的起源。
大多数编辑和渲染应用程序都以某种形式进行了优化,以利用CUDA内核,因而在零碎中增加更多功能将使您可能更好,更快地渲染模型、视频等。
一些风行的GPU渲染引擎(例如Octane和Redshift)是基于Nvidia的CUDA构建的,这意味着只有领有Nvidia GPU能力应用它们。在此类渲染引擎中,渲染性能简直与GPU具备的CUDA Cores数量成线性比例关系。
某些应用程序(例如Adobe的After Effects或Premiere Pro)带来了对Nvidia和AMD GPU的反对,但通常在Nvidia GPU上运行得更快。
GeForce还是Quadro?
当波及到编辑视频和原始3D应用程序性能之类的事件时,GeForce将为您带来最大的价值。
然而,因为GeForce是一个次要面向游戏玩家和一般消费者的品牌,因而高端专业人士可能须要短少某些性能。
Quadro能够在许多应用程序中提供高性能,然而吸引人的要点是其对企业用户的软件反对。
与GeForce相比,任何取得的性能都要付出昂扬的价格。
然而,如果您须要ECC(纠错代码存储器)或相对适宜业余应用程序的最佳驱动程序,则Quadro是最佳抉择~
GeForce专一于游戏和消费者,Quadro专一于企业和企业用户。
此外,Quadro还将具备更高的CUDA内核和VRAM数量,并且有时还会具备诸如ECC之类的独有性能,咱们将在稍后具体阐明。
总体而言, 咱们向以下用户举荐Quadro:
- 能够冲销高价作为业务费用
- 能够利用ECC,更大的VRAM,更高的浮点精度,更高的监视器位深度
- 须要仅专业级GPU反对的非凡软件性能(例如Solidworks,Autocad…)
- 定期依附软件供应商的保护和反对
- 须要对其硬件进行全面测试,以确保其在企业或服务器环境中的持久性和稳定性,即便在24/7失常运行工夫下
咱们向以下用户举荐GeForce:
- 不要利用仅PRO级GPU反对的性能
- 想要更多的钱来赚钱
- 不肯定须要大量的VRAM或ECC
- 不要依赖其应用程序供应商的惯例软件反对
- 可能还想时不时地玩游戏
我须要RTX吗?
Nvidia的“ Turing”架构是第一个引入RTX的架构,它在CUDA内核(即RT和Tensor内核)之上带来了一些新性能。
图像起源:Nvidia
RT内核是用于光线跟踪的,并且是专门为它而构建的。
对于业余渲染,至多在受反对的应用程序中,领有更弱小的光线跟踪GPU能够大大放慢工作量。
如果您不须要光线跟踪GPU(尤其是如果您专一于视频编辑而不是3D渲染),那么RT内核的呈现就不会带来很大的不同。
Tensor外围是另一个故事,变得更加乏味。
在消费类GPU中,Tensor内核用于实现DLSS(深度学习超级采样)等性能,该性能应用AI来改善图像品质。
对于业余用处,Tensor内核能够利用其弱小的FP16 / FP32和INT4 / 8性能,使其成为神经网络、深度学习、人工智能等的现实抉择。
如果这些畛域听起来像您的企业想要摸索的货色,那么Quadro RTX可能就是您想要的。
至多在受反对的渲染引擎中,RT Core还可大大提高渲染速度。例如,Octane和Redshift正在钻研应用RayTracing Cores的实现。
总之,RT和Tensor内核增加了一些丑陋的额定性能,这些性能可能会或可能不会对您的工作量产生影响。
然而,咱们依然倡议将RTX GPU替换为上一代Nvidia GPU,因为即便不利用这些额定的解决内核,最新的RTX GPU的确比非RTX前辈具备显着的性能晋升。
编辑GPU须要什么?
与业余渲染相比,视频编辑须要的GPU需要要少得多。
甚至您的具备CUDA内核的Nvidia的根本消费类GPU都能够在这里实现工作,尤其是当您只是一个从事自由职业或公布到YouTube等网站的内容创建者时。
查看以下Premiere Pro视频编辑基准,能够分明地显示GPU Sweet Spot所在的地位:
视频和照片编辑不须要任何想象力,就不须要夸大的Quadro GPU规格和价格标签,因而您将非常适合低端或中端GeForce RTX GPU。
如果您的需要是更多企业级的(即4K / 8K HDR视频),那么您可能心愿抉择高端GeForce RTX GPU。
您须要渲染GPU有什么性能?
从渲染GPU(在业余环境中进行显式3D渲染),您将须要GPU的更多帮忙。
渲染GPU(鉴于它与您正在应用的渲染引擎兼容)所须要的最大性能就是尽可能多的CUDA外围和VRAM。
在GPU上渲染均匀帧所破费的工夫与GPU领有的CUDA外围数量简直成线性正比。
然而,如果3D场景数据适宜其VRAM(GPU上的视频内存),则GPU只能利用其微小的CUDA Core性能。
这意味着,如果您晓得具备数百万个多边形,子多边形位移或诸如大型纹理之类的非常复杂的场景,则对VRAM的需要将比仅蕴含几个对象的场景相当简略的状况要高得多。
大多数GeForce RTX GPU曾经具备相当数量的VRAM,通常在8GB至11GB之间,然而如果您须要更多,则必须应用Quadro RTX GPU,它具备高达48GB的VRAM。
在Quadro GPU中,您还将取得ECC,咱们当初将对其进行解释。
ECC:它是什么,以及为什么您须要它
ECC是指纠错代码存储器。
ECC内存可检测并纠正在长期的高强度工作负载过程中天然产生的数据谬误。
这些谬误是造成看似随机的事件(如数据损坏或系统故障)的起因,在解决足够软弱的数据时,必须不惜一切代价防止这些谬误。
这就是为什么ECC最罕用于服务器和企业PC中的起因-为了避免这些谬误在造成最重大侵害时产生。
在GPU中,ECC是Nvidia和AMD的业余GPU独有的。
在Nvidia的状况下,这些仅在Nvidia Quadro GPU中存在,并且对于避免某些状况下的致命谬误是必须的。
然而,大多数未集成到企业工作流中的消费者和创建者能够释怀地疏忽ECC。
评估体现
评估给定GPU性能的第一个也是最好的办法是查看基准。
通常,消费者会查看游戏和其余应用程序的基准,以最好地理解给定组件的性能。
通常,这里也实用雷同的观点,然而您的确须要晓得应该关注哪些基准。
为了进行GPU渲染,您具备受欢迎的GPU渲染引擎(例如OctaneBench,Redshift和VRAY -RT)的基准。
其余资源也可能会有所帮忙,包含Passmark的GPU计算基准表(用于掂量DirectCompute / OpenCL性能)。
除了基准测试外,还有外围规格,咱们将在以下每个精选下列出这些规格。
咱们要解决的外围规格是:
- CUDA外围——对应于原始解决能力(3D渲染性能的微小指标)
- Tensor外围——对应于深度学习/ AI性能以及FP32 / 16工作负载
- RT外围——对应于光线追踪性能,能够成为受反对的渲染引擎中3D渲染的加速器
- VRAM ——用于治理较大的场景,编辑等,而不会占用过多的内存
- GPU频率——GPU外围速度的度量
顶级GeForce和顶级RTX GPU规格表
留神:理论价格可能有所不同。Quadro RTX卡通常比MSRP便宜得多,而非Quadro卡通常比MSRP更高或更低。
从表中能够看出,最大的硬件差别归结为大幅晋升的VRAM(带有ECC),以及显着晋升了CUDA,Tensor和RT内核,至多在高端方面如此。
除了蕴含ECC外,Titan RTX还提供与高端Quadro RTX卡相似的规格。
要害要点:
在GeForce上抉择Quadro的次要起因是为了加强稳定性以及对企业级软件的驱动程序反对–否则,GeForce卡在许多状况下都能够以更低的价格取得类似的性能。
我应该用双GPU吗?
如果您要构建游戏零碎,咱们的答案将非常简单:不,相对不是。
在游戏方面,多GPU反对已大大减少,不倡议应用。
然而为了进步生产力……嗯,这是另一回事了。
游戏须要利用SLI之类的规范来利用多个GPU渲染一个场景,而大多数编辑和渲染应用程序都是在思考分布式工作负载的状况下进行的。
这意味着您不仅不须要GPU完满协调地工作就能够同时领有两张卡,而且还能够看到线性的2倍性能晋升,从而能够在工作负载中减少另一个GPU!
双GPU并不是高端产品。随着在兼容零碎中增加更多卡,工作负载(如3D-GPU渲染)的性能简直呈线性增长,对于3D-Artists,装备多达4个GPU的HEDT PC是很常见的。
对于Nvidia的NVLINK的一小段内容:
然而,要利用NVLINK内存共享,您将须要比RTX 2070 Super更高层的GPU。此外,应用NVLINK一次不能在两个以上的GPU之间共享内存,并且须要渲染引擎反对能力应用这些性能。
您将须要NVLINK桥来连贯两张卡。
在Adobe Premiere Pro中用于视频编辑的双/多GPU设置?
Premiere Pro不会在零碎中应用多个GPU,因而您不会从多个GPU中受害。
最佳编辑和渲染图形卡:瑞云的举荐抉择
1、最佳价值编辑和渲染GPU:Nvidia RTX 2060 Super
参数:
- CUDA外围– 2176
- Tensor Cores – 272
- RT内核– 34
- VRAM – 8GB GDDR6
- GPU频率– 1470 MHz(根本)
如果您估算无限,但仍心愿在花钱进行编辑和渲染工作时取得良好的性能,则RTX 2060 Super将是咱们的首选。
与同价位的其余GPU相比,它为游戏和业余工作提供了全面的卓越性能。(不过,对于游戏而言,AMD RX 5700相对是更好的抉择。)
RTX 2060 Super具备适量的RT和Tensor外围以及相当数量的CUDA外围,足以编辑1080p和1440p视频。
在OctaneBench中,该卡的得分约为205,这比Quadro RTX 3000(在149)和Quadro RTX 5000(在184)要好得多。
这意味着2060 Super可用的原始计算能力甚至超过价格比其价格高出数倍的Quadro RTX卡,这当然还不错。
这些问题使RTX 2060 Super在计算性能上稳居单个GPU卡的中端。
对于那些刚开始进行编辑和渲染的人,或者还没有数千美元的硬件投资,RX 2060 Super是一个现实的终点。
须要双GPU?取而代之的是鼓风机格调的RTX 2060 Super
2、最佳高端编辑和渲染GPU:Nvidia RTX 3090
参数:
- CUDA外围——10496
- Tensor Cores——328
- RT外围——82
- VRAM——24GB GDDR6X 9
- GPU频率——1400 MHz(根本)
如果您估算不紧,又不须要ECC,又不想卖肾脏来买显卡,请购买Nvidia RTX 3090。
出于游戏目标,与低端同类产品相比,RTX 3090并没有真正进步每美元的性能。
然而,与上述非Ti同类产品相比,它的原始计算性能的确有了显着进步,这使其成为“编辑和渲染”中更具吸引力的抉择。
在OctaneBench中,RTX 3090得分为661,就单GPU性能而言,它巩固位置于高端单GPU卡上。
思考到所有这些因素,RTX 3090成为了该级别的首选。如果您要解决1440p / 4K视频或惯例的高要求渲染工作,则3090是最适宜该工作的显卡之一。
3、最佳高端业余GPU:Nvidia Quadro RTX 6000
参数:
- CUDA外围——4608
- Tensor Cores——575
- RT外围——72
- VRAM——24 GB GDDR6(ECC)
- GPU频率——1440 MHz(根本)
最初但同样重要的是,让咱们看一下Quadros。
在原始性能方面,在受VRAM限度的场景之外,Quadro RTX 6000不会比RTX 2080 Ti更好。
这在OctaneBench中失去了反映,该结果显示2080 Ti的302仅308英寸——难以置信的边际差别。然而,如果您已浏览该文章,则可能曾经弄明确了那局部。
取得Quadro RTX卡的次要动机是加强的软件反对,稳定性和ECC RAM反对。
如果您想要在这个性价比范畴内的产品,但Quadro RTX 6000不能提供您所须要的产品,请思考以下三种抉择。
如果此卡看起来有点受VRAM的限度,请抉择Quadro RTX8000。大多数规格雷同,但VRAM却减少了一倍。
非VRAM绑定计划中的性能差别十分无限。
如果ECC对您的工作负载无关紧要,那么您也能够便宜得多,并取得具备简直雷同规格的Nvidia Titan RTX。
如果ECC不要紧,你的工作量和你不介意多付大概在同一价格,还要思考泰坦V。
它没有RT内核,然而它的确具备足够的计算能力——依据OctaneBench的说法,是所有单个GPU中最好的——并且它依然具备更多的Tensor和CUDA内核能够应用。不过,它的确具备更少的VRAM。