说到显卡,预计 90% 以上的人都认为这就是一个游戏工具。当初高性能的显卡难道只是为游戏而生吗?目前不少公司曾经意识到 GPU 大规模并行计算带来的劣势,开始用弱小的多 GPU 服务器进行各种方向的钻研,而这些钻研除了能给公司带来微小收益外,其研究成果也开始利用在咱们的日常生活中。
什么是 GPU 服务器?
GPU 服务器是基于 GPU 的利用于视频编解码、深度学习、科学计算等多种场景的疾速、稳固、弹性的计算服务。
GPU 服务器有什么作用?
GPU 减速计算能够提供不凡的应用程序性能,能将应用程序计算密集局部的工作负载转移到 GPU,同时仍由 CPU 运行其余程序代码。从用户的角度来看,应用程序的运行速度显著放慢.
了解 GPU 和 CPU 之间区别的一种简略形式是比拟它们如何解决工作。CPU 由专为程序串行解决而优化的几个外围组成,而 GPU 则领有一个由数以千计得更小、更高效的外围(专为同时解决多重工作而设计)组成的大规模并行计算架构。
GPU 服务器的次要利用场景
海量计算解决
GPU 服务器超强的计算性能可利用于海量数据处理方面的运算,如搜寻、大数据举荐、智能输入法等:
• 本来须要数天实现的数据量,采纳 GPU 服务器在数小时内即可实现运算。
• 本来须要数十台 CPU 服务器独特运算集群,采纳单台 GPU 服务器可实现。
深度学习模型
GPU 服务器可作为深度学习训练的平台:
1.GPU 服务器可间接减速计算服务,亦可间接与外界连贯通信。
2.GPU 服务器和云服务器搭配应用,云服务器为主 GPU 云服务器提供计算平台。
3. 对象存储 COS 能够为 GPU 服务器提供大数据量的云存储服务。
如何正确抉择 GPU 服务器?
抉择 GPU 服务器时首先要思考业务需要来抉择适宜的 GPU 型号。在 HPC 高性能计算中还须要依据精度来抉择,比方有的高性能计算须要双精度,这时如果应用 P40 或者 P4 就不适合,只能应用 V100 或者 P100;同时也会对显存容量有要求,比方石油或石化勘探类的计算利用对显存要求比拟高;还有些对总线规范有要求,因而抉择 GPU 型号要先看业务需要。
当 GPU 型号选定后,再思考用什么样 GPU 的服务器。这时咱们须要思考以下几种状况:
第一、在边缘服务器租用上须要依据量来抉择 T4 或者 P4 等相应的服务器,同时也要思考服务器的应用场景,比方火车站卡口、机场卡口或者公安卡口等;在核心端做 Inference 时可能须要 V100 的服务器,须要思考吞吐量以及应用场景、数量等。
第二、须要思考客户自身应用人群和 IT 运维能力,对于 BAT 这类大公司来说,他们本人的经营能力比拟强,这时会抉择通用的 PCI- e 服务器;而对于一些 IT 运维能力不那么强的客户,他们更关注数字以及数据标注等,咱们称这类人为数据科学家,抉择 GPU 服务器的规范也会有所不同。
第三、须要思考配套软件和服务的价值。
第四、要思考整体 GPU 集群零碎的成熟水平以及工程效率,比方像 DGX 这种 GPU 一体化的超级计算机,它有十分成熟的从底端的操作系统驱动 Docker 到其余局部都是固定且优化过的,这时效率就比拟高。
作为国内品牌服务器提供商,服务器在线 GPU 机架式服务器领有大规模并行处理能力和无可比拟的灵活性。
它次要利用于为计算密集型利用提供足够的解决能力。GPU 减速运算的劣势就在于它能够一边由 CPU 运行利用程序代码,一边由图形处理单元(GPU)解决大规模并行架构的计算密集型工作。