关于机器学习:高性能计算在处理和吞吐量方面的重大突破

38次阅读

共计 1332 个字符,预计需要花费 4 分钟才能阅读完成。

高性能计算 (HPC) 利用超级计算机和并行处理技术,疾速实现耗时较长的工作或同时实现多个工作。HPC 市场既是一个传统的市场,又是一个新兴的、高速倒退的市场。定位高端用户、标杆我的项目,影响力大、平民化趋势、疾速倒退。高性能计算的工作原理在高性能计算中,解决信息的两种次要形式为:串行解决,由中央处理器 (CPU) 实现。每个 CPU 外围通常每次只能解决一个工作。CPU 对于运行各种性能而言至关重要,如操作系统和根本应用程序(如文字处理、办公生产力工具等)。

并行处理,可利用多个 CPU 或图形处理器 (GPU) 实现。GPU 最后是专为图形处理而设计的。它可在数据矩阵(如屏幕像素)中同时执行多种算术运算。同时在多个数据立体上工作的能力使 GPU 非常适合在机器学习 (ML) 利用工作中进行并行处理,如辨认视频中的物体。

冲破超级计算的极限须要不同的零碎架构。大多数高性能计算零碎通过超高带宽将多个处理器和内存模块互连并聚合,从而实现并行处理。一些高性能计算零碎将 CPU 和 GPU 联合在一起,被称为异构计算。计算机计算能力的度量单位被称为“FLOPS”(每秒浮点运算次数)。截至 2019 年初,现有的高端超级计算机能够执行 143.5 千万亿次 FLOPS (143 × 1015)。此类超级计算机被称为千万亿次级,能够执行超过千万亿次 FLOPS。相比之下,高端游戏台式机的速度要慢 1,000,000 倍以上,可执行约 200 千兆次 FLOPS (1 × 109)。超级计算在解决和吞吐量方面的重大突破很快将会实现超级计算的下一个重大级别——百亿亿次级,该级别的速度比千万亿次级约快 1,000 倍。这意味着百亿亿次级超级计算机每秒将可能执行 1018(或者 10 亿 x 10 亿)次运算。

“FLOPS”是对实践处理速度的形容,实现该速度须要间断向处理器传输数据。因而,零碎设计必须思考到数据吞吐量这一因素。零碎内存以及解决节点之间的互连会影响数据传输到处理器的速度。

为了实现 1 百亿亿次级 FLOPS 的下一级超级计算机解决性能,大略须要 5,000,000 个台式机。* 假设每个台式机具备 200 千兆次 FLOPS 的能力。术语常识高性能计算 (HPC):一个狭义上的弱小计算零碎,其范畴涵盖简略计算机(如 1 个 CPU + 8 个 GPU),乃至世界一流的超级计算机超级计算机:最先进的高性能计算机,以一直进步的性能规范为根据异构计算:优化串行 (CPU) 和并行 (GPU) 解决能力的高性能计算架构内存:在高性能计算零碎中为实现快速访问而存储数据的中央互连:可令解决节点相互通信的零碎层;在超级计算机中存在多个级别的互连千万亿次级:为达到每秒执行千万亿次 (1015) 运算而设计的超级计算机百亿亿次级:为达到每秒执行百亿亿次 (1018) 运算而设计的超级计算机为什么要做高性能计算?从零碎的角度:集成系统资源,以满足一直增长的对性能和性能的要求从利用的角度:适当合成利用,以实现更大规模或更粗疏的计算解决问题: 迷信和工程问题的数值模仿与仿真(计算密集、数据密集、网络密集、三种混合)。HPC 报告合集:2020 年 HPC 市场总结和预测报告 2021 年 HPC 市场剖析汇总 HPC/AI 市场剖析汇总 HPC 解决方案设计及测试规范汇总残缺内容下载链接:《高性能计算与高性能计算机》

正文完
 0