共计 1159 个字符,预计需要花费 3 分钟才能阅读完成。
百度智能云新一代高性能 AI 计算集群落地,提供 EFLOPS 级算力反对,并公布新一代 GPU 服务器实例 GPU-H5-8NA100-IB01。该集群基于 NVIDIA A100-80GB GPU 和 NVIDIA InfiniBand 网络构建,成为当先的 AI 原生云算力底座。
钻研人员可基于全新公布的实例组建上千节点规模的超高性能计算集群,成倍缩短超大 AI 模型的训练工夫,激发 AI 业务翻新想象力。
新的 GPU 服务器实例采纳百度自研的 X-MAN 架构的超级 AI 计算机为硬件平台。
X-MAN 自 2016 年推出以来,已在凤巢、主动驾驶、自然语言解决等百度外部业务进行大规模利用多年,申请六项专利,包含 PCie Fabric 架构、液冷技术、最大反对 64 GPU 卡扩大等,是百度 AI 业务疾速落地的重要基础设施。
目前,X-MAN 曾经全面降级到第四代 X-MAN 4.0,为 AI 和 HPC 等计算场景进行了新的优化设计。
配置方面,每台 X-MAN 4.0 蕴含 8 张 NVIDIA A100-80GB GPU,并可反对 8 张 200Gb/s 的 InfiniBand 网卡,实现了高速存储、高速无阻网络、高性能计算于一体的超级 AI 计算机。
架构方面,X-MAN 4.0 全新设计的架构缩短了数据传输提早,进步了数据传输带宽,无效解决本地数据传输的通信瓶颈,升高 AI 作业中 GPU 的闲置工夫。在 MLCommons 1.1 榜单中,X-MAN 4.0 在同配置单机硬件性能名列 TOP2。
为了实现更高的集群运行性能,百度智能云专门设计了实用于超大规模集群的 InfiniBand 网络架构。这个架构优化了网络收敛比,晋升了网络吞吐能力。并联合容错、交换机亲和,拓扑映射等伎俩,得以将 EFLOPS 级算力的计算集群性能施展到极致。
通过外部 NLP 钻研团队的验证,在这个网络环境下的超大规模集群上提交千亿模型训练作业时,等同机器规模下整体训练效率是一般 GPU 集群的 3.87 倍。
百度副总裁谢广军学生示意:“AI 原生云是推动企业智能化降级的外围驱动力。作为中国 AI 私有云服务市场领跑企业,百度智能云始终在优化晋升智能计算的外围能力。X-MAN 4.0 助力百度外部业务倒退的同时,咱们也违心将这一当先的架构凋谢给百度智能云的泛滥客户,帮忙大家一起更高效地进行 AI 研发与摸索,驱动业务翻新,迈向 AI 原生。”
即日起,百度智能云的客户能够在如下网址进行 GPU 云服务器计算实例 GPU-H5-8NA100-IB01 的申购:https://cloud.baidu.com/product/gpu.html?track=weixin
为了帮忙客户更深刻地理解新的 GPU 服务器实例,以及超大规模的高性能集群构建的技术细节,百度智能云将与 NVIDIA 于 3 月 16 日 19:00 举办在线研讨会进行具体分享,解答客户的问题,请返回 B 站【百度智能云的敌人们】进行观看。