关于人工智能:高温凶猛你的服务器要不要冲个凉

1次阅读

共计 3637 个字符,预计需要花费 10 分钟才能阅读完成。

出门烫 jio、几乎热哭了、河南热成了可南……

就在上周,河南低温成为全国热议的话题。据河南气象局数据统计显示,河南全省有 49% 的县市气温超过 40℃,最热的竟然是郑州。其实也不仅是河南,整个北方地区最近都迎来了新一轮低温,大家出门在外的惟一想法就是——赶快回家冲个凉。

比人更不耐高温的则是电子设备。你必定遇到手机过热关机的状况,但你或者不晓得,这其实是一种自我保护方式,因为低温可是许多电子元器件的大敌,轻则零碎运行速度变慢、性能降落,重则电子激活水平加剧导致半导体元件热击穿,造成不可逆的物理损坏。所以冬季降温对于电子设备来说至关重要,尤其是作为数字化“心脏”的数据中心,如何保障成千上万台零碎的散热,也成为了冬季的热门话题。

在以前,每到冬季数据中心总会让空调全力运行,以解决数据中心产生的微小热量,由此也带来了能耗回升的问题,使得数据中心的 PUE 进步不少。然而当初就不行了——随同着工信部《新型数据中心倒退三年行动计划(2021—2023 年)》的提出,国家从政策层面曾经明确到 2023 年底,新建大型及以上数据中心 PUE 降到 1.3 以下。这一硬指标与时间表的设定,对于数据中心的能耗提出了新要求,也促使数据中心必须转变传统的散热模式,采纳更节能、更高效的解决方案。

面对低温,人人都渴望冲个凉,那为什么服务器不能够?

冷板式液冷,数据中心能效比首选

如果放在 20 年前,液冷还是很时尚的,大家很好奇这个小管子外面装的到底是什么。然而现在,不要说企业,就是集体也有不少都用上了液冷散热的电脑,公众的接受度也在逐渐晋升中。尤其是对于数据中心来说,面对“双碳”压力、面对节能减排的需要,液冷就提供了一个十分好的计划——通过冷却液将外围设施的温度控制在较低的范畴内,同时也大大节俭了空调等散热设施的能耗,堪称是两全其美。于是在技术成熟和政策激励的双重加持下,数据中心也开启了液冷利用的新时代。

“目前服务器液冷从大的方向上来看,次要三种形式在并行——冷板式液冷、喷淋式液冷和浸没式液冷”,在谈到液冷技术和利用场景的时候,浪潮信息数据中心产品部总经理赵帅一五一十。所谓冷板式液冷,就是在热源上覆一块水冷板,通过液体流动把热量带走。绝对于传统的“风扇 + 散热片”的制冷形式,冷板式液冷在最小老本晋升的状况下最大化了利用成果,最容易被用户所承受。

相比之下,无论喷淋式液冷还是浸没式液冷的技术都要简单得多,也都须要数据中心从物理状态上进行改革。这对于绝大多数用户来说显得较为激进,实用于齐全新建的我的项目,而且从老本来说后期也须要较大投资。也是在综合思考业界的多种解决方案之后,浪潮信息将冷板式液冷作为主攻方向,并定下了 ”All in 液冷 ” 的倒退策略,全栈布局液冷。在日前召开的绿色算力技术研讨会上,浪潮信息公布全栈液冷产品——液冷通用服务器、液冷高密度服务器、液冷整机柜服务器、液冷 AI 服务器等,向业界提供全套液冷产品和解决方案。

在这次公布的产品中,既有全场景适配、基于英特尔® 至强® 第三代可扩大处理器打造的通用旗舰机型 NF5280M6,也有面向高密度多节点利用的 i24LM6 服务器,还有面向大规模数据中心节能降耗需要、实现一体化交付的液冷整机柜服务器 ORS3000S,以及面向人工智能利用、反对多个 GPU 加速卡的 NF5498LA5 服务器等等,满足数据中心绿色高质量倒退的多样化场景需要,实现“量身定做”。

为什么要设计这么多冷板式的服务器?有没有相似超交融之类“一站式”的液冷产品呢?对于这个问题,其实浪潮信息的研发和产品设计团队早就思考过,很显然如此丰盛、多样化的产品线是无意为之。“你会发现一个用户在购买服务器的时候,肯定不会只购买一种类型的服务器。很多客户会购买通用服务器、也会购买高密度服务器,很多时候还会部署具备异构减速性能的 AI 服务器等等。如果只在一类服务器上作业,满足不了客户把高算力设施全副进行液冷化的建设初衷,这是咱们在各个节点上布局的基本出发点”,在谈到为什么会筹备多样化的液冷设施时,赵帅解释说。

浪潮信息数据中心产品部总经理 赵帅

其实浪潮信息的筹备还远不止于此。面对将来数据中心大规模利用的需要,赵帅和团队成员们更是筹备了包含预制化数据中心、模块化液冷数据中心的整体解决方案。因为在理论利用中他们发现,许多客户想要的数据中心超低 PUE,不仅仅须要某一款设施的低能耗来实现,同时还须要诸多的辅助设施。比方对液冷技术来说,一方面须要在服务器外部进行配置、装置管线,另一方面还包含室外机、供电系统、冷却塔等一次侧或者二次侧的液冷服务设施。这些设施尽管并没有全副部署在机房外部,却也是为数据中心服务的。而对于这些设施,客户往往不足足够的认知和应用能力,因而客户也更心愿浪潮信息能提供一体化的解决方案,这样能力实现从室内到室外的一站式液冷赋能。

如此一来,无论是新建模块化液冷数据中心、预制化液冷数据中心,还是风液式或纯液冷老旧机房革新,浪潮信息都可能实现从后期布局征询、中期设施定制、前期交付施工的端到端服务,为客户打造全生命周期最优的液冷解决方案,满足简单多样的数据中心建设需要。

打造液冷行业标准,共建节能生态系统

许多人可能会好奇液冷数据中心的老本,毕竟绝对于传统风冷来说,液冷在结构上更为简单,由此也就带来了初期建设老本的晋升。那么,这是否意味着液冷的应用老本会更高呢?恰恰相反,赵帅饶有兴趣的帮咱们算了一笔账,其实液冷数据中心会更划算。

一般来说,数据中心的寿命是 10 年左右,服务器一代的使用寿命是 5 年左右,业内也大多从总体领有老本的角度来思考盈亏问题。赵帅团队的测算结果显示,尽管在洽购初期,液冷数据中心确实须要减少约 10% 的投资,但因为 PUE 更低、更省电,大略在一年半至两年的工夫,其节俭的电费就能够笼罩后期多出的液冷建设老本。这也意味着在总计 5 年的生命周期中,剩下 3 年左右的工夫,冷板式液冷服务器的能耗均小于传统服务器,思考到数据中心动辄成千上万台服务器的规模,每年节俭的老本是十分可观的。将来通过冷板的标准化、批量化生产,可能更加缩小数据中心液冷革新的初期投资老本。

当然更多的节俭在于整个行业的大规模遍及,这就须要标准化的标准。在服务器反对液冷之后,传统的 IDC 机房外面曾经部署的机柜是能够通过革新来反对液冷的,然而目前因为规范匮乏会比拟艰难。

“机柜的机身要多深能力做液冷化革新?机柜要在哪些地方留下足够的孔位去装置机柜级的分集水器?在哪些地方装置 PDU?在哪些地方预留进水的管路?当初没有统一标准,所以无奈间接做革新。浪潮信息心愿拉通产业、拉通客户,大家一起把规范给做进去,比方针对机柜、PDU、分集水器、快接头等各种部件设立技术标准,有了规范就意味着当前所有的机柜都无须再通过非凡的解决或全副更换,只须要通过简略的革新就能够反对液冷”,赵帅说。

为更好的推动液冷规模化、产业化,浪潮信息建成了亚洲最大的液冷数据中心研发生产基地——天池。天池是当先的液冷翻新核心,满足了不同规格液冷服务器的各项研发、生产、测试需要,构筑了研发、测试、生产、品控、交付的全链条液冷智造能力,年产量 10 万台,实现了业界首次冷板式液冷整机柜的大批量交付,帮忙用户数据中心 PUE 升高至 1.1 以下,整体交付周期在 5 - 7 天之内。

一枝独秀不是春,百花齐放春满园。对于液冷技术产业化来说,这不是欲速不达的事,也不是浪潮信息一家的事。任何一项规范的制订,都须要从政策、行业、产业等多个角度、多方参加,天然也就须要一个漫长的过程。不过在这期间,浪潮信息还是积极探索可能的技术路线,从利用层面为客户带来更好的体验。比方与顶尖高校实验室单干摸索优化冷板材质,继续晋升不同材质的耐腐蚀性、抗氧化性和热传导性;再比方严格品控治理,冷板快接头可耐受 5000 次插拔,保障长期应用可靠性,液冷换热单元等部件出厂前接受触动、跌落、盐雾,霉菌重重试验以达到出厂品质要求等等,都秉承着业余、负责的态度。

现在,液冷技术曾经不再是从前那样曲高和寡,在国家“双碳”和“东数西算”策略的独特推动下,包含互联网、金融、电信、能源、医疗等多个关乎国计民生的行业都开启了液冷化的过程,也通过小规模试点进行摸索。相比之下在互联网行业,液冷走得更快一些,目前包含京东在内的诸多大厂也开始了液冷设施的利用。据京东科技 JDT 京东云事业部、硬件架构部架构师王贵林介绍,京东很早就开始了液冷技术的摸索和研发,并基于液冷技术搭建了其新一代数据中心,使得整体 PUE 失去了无效升高,运行效力大大晋升。

依据生态环境部颁布的数据,2021 年,我国数据中心耗电量占全社会用电量的 2.6%,而将来社会对算力的需要仍将以每年 20% 以上的速度增长,行业对电力的需要也会持续减少。在这样的趋势下,数据中心行业低碳节能曾经迫不及待,而液冷技术则可能无效解决这个问题。在为服务器带去阵阵“清凉”的同时,也可能推动数字经济的安稳、疾速倒退。

既然计算需要这么火爆,你的服务器是不是也该冲个凉了?

正文完
 0