关于深度学习:最全讲解GPU技术架构知识

43次阅读

共计 2229 个字符,预计需要花费 6 分钟才能阅读完成。

GPU 的起源

GPU 缩写为 Graphics Processing Unit 的,个别称为视觉处理单元。

GPU 被宽泛用于嵌入式零碎、移动电话、个人电脑、工作站和电子游戏解决方案当中。

古代的 GPU 对图像和图形处理是非常高效率的,这是因为 GPU 被设计为很高的并行架构这样使得比通用处理器 CPU 在大的数据块并行处理算法上更具备劣势。

1985 年 8 月 20 日 ATi 公司成立,同年 10 月 ATi 应用 ASIC 技术开发出了第一款图形芯片和图形卡,1992 年 4 月 ATi 公布了 Mach32 图形卡集成了图形减速性能,1998 年 4 月 ATi 被 IDC 评比为图形芯片工业的市场领导者,但那时候这种芯片还没有 GPU 的名称,很长的一段时间 ATI 都是把图形处理器称为 VPU,直到 AMD 收买 ATI 之后其图形芯片才正式采纳 GPU 的名字。

NVIDIA 公司在 1999 年公布 GeForce 256 图形处理芯片时首先提出 GPU 的概念。

从此 NVIDIA 显卡的芯片就用这个新名字 GPU 来称说。GPU 使显卡削减了对 CPU 的依赖,并执行局部本来 CPU 的工作,尤其是在 3D 图形处理时。

GPU 所采纳的核心技术有钢体 T &L、立方环境材质贴图与顶点混合、纹理压缩及凹凸映射贴图、双重纹理四像素 256 位渲染引擎等,而硬体 T &L 技术可能说是 GPU 的标记。

对于 GPU 必须晓得的基本知识

图形处理单元(或简称 GPU)会负责解决从 PC 外部传送到所连贯显示器的所有内容,无论你在玩游戏、编辑视频或只是盯着桌面的壁纸,所有显示器中显示的图像都是由 GPU 进行渲染的。

对普通用户来说,实际上不须要独立显卡就能够向显示器「提供」内容。像笔记本电脑或平板用户,通常 CPU 芯片都会集成 GPU 内核,也就是大家熟称的「核显」,这样就能够为对显示要求不高的低功耗设施提供更好的性价比。

正因如此,局部笔记本电脑、平板电脑和某些 PC 用户来说,要想将其图形处理器降级到更高级别也很艰难,甚至不太可能。

这就会导致游戏(和视频编辑等)性能不佳,只能将图形品质设置升高能力工作。对此类用户而言,只有在主板反对和闲暇空间足够的状况下,增加新显卡才可能把(游戏)显示体验进步到一个新的程度。

GPU 工作流程

GPU 目前已成为 PC 外部最弱小的组件之一,其性能大部分都来自于 VRAM。因为独立显卡应用的显示内存独立于计算机内存,这些存储器模块容许疾速存储和接收数据,而不用再通过 CPU 路由到主板上插的内存。

尽管显卡内存与计算机内存类似,但却齐全不同,例如:反对 DDR4 内存的主板也可能会反对 GDDR5 RAM 的显卡。显卡上的 VRAM 用于在卡上疾速存储和拜访数据,以及为显示器缓冲渲染帧。其还有助于升高影响屏幕上近似数据的「锯齿状边缘」以实现抗锯齿,使图像看起来更平滑。

顶点解决:这阶段 GPU 读取形容 3D 图形外观的顶点数据并依据顶点数据确定 3D 图形的形态及地位关系,建设起 3D 图形的骨架。在反对 DX8 和 DX9 规格的 GPU 中,这些工作由硬件实现的 VertexShader(定点着色器)实现。

光栅化计算:显示器理论显示的图像是由像素组成的,咱们须要将下面生成的图形上的点和线通过肯定的算法转换到相应的像素点。把一个矢量图形转换为一系列像素点的过程就称为光栅化。例如,一条数学示意的斜线段,最终被转化成阶梯状的间断像素点。

纹理帖图:顶点单元生成的多边形只形成了 3D 物体的轮廓,而纹理映射(texturemapping)工作实现对多变形外表的帖图,艰深的说,就是将多边形的外表贴上相应的图片,从而生成“实在”的图形。TMU(Texturemapping unit)即是用来实现此项工作。

像素解决:这阶段(在对每个像素进行光栅化解决期间)GPU 实现对像素的计算和解决,从而确定每个像素的最终属性。在反对 DX8 和 DX9 规格的 GPU 中,这些工作由硬件实现的 Pixel Shader(像素着色器)实现最终输入,由 ROP(光栅化引擎)最终实现像素的输入,1 帧渲染结束后,被送到显存帧缓冲区。

GPU 散热

要利用好 GPU 的原始设计效力必须有大量供电,大量用电就意味着大量发热。显卡(或处理器)产生的热量是以热设计功耗(或简称 TDP)和瓦特为单位测量的。但商家对产品的标称并不是间接所需的功耗值,例如新的 GTX 1080 标称为 180W TDP 等级,但这并不意味着它须要 180W 的功率。

之所以揭示大家关怀这个值是因为,具备较高 TDP 的 GPU 用到无限空气流动的紧凑空间中可能会导致散热问题。特地是对 GPU 超频的用户来说,须要有足够的冷却伎俩来解决减少的热量,能力让其稳固运行。

GPU 术语

架构:GPU 基于的平台(或技术)。个别由 GPU 厂商进行定义,如 AMD 的 Polaris 架构。

显存带宽:它决定了 GPU 如何无效地利用可用的 VRAM。显卡能够应用 GDDR5 内存,但如果没有无效地利用带宽依然会有瓶颈。

纹理填充率:指 GPU 在单位工夫内所能解决的纹理贴图的数量,单位是 MTexels/S,由内核时钟乘以可用纹理映射单元(TMU)确定。

内核 / 处理器:显卡上可用的并行内核(或处理器)数。

外围时钟:与 CPU 的时钟速率相似,通常该值越高 GPU 则可能更快地工作。

SLI/CrossFire:SLI 和 CrossFire 别离是 Nvidia 和 AMD 应用的技术,它们容许用户装置多块 GPU 卡并协同工作。

显卡解决图形问题和其余工作的泛滥外围都是专门设计的,弱小的显卡和 GPU 能够为游戏提供更高的保真度和分辨率,尽管它比 CPU 更弱小,但理论只能用于特定的应用程序。

正文完
 0