背景
近年来,国家对算力的器重水平一直晋升。在算力基础设施方面,先后公布《全国数据中心利用倒退指引》、《对于放慢构建全国一体化大数据中心协同翻新体系的领导意见》等;在算力服务方面,公布了《推动企业上云施行指南》、《云计算倒退三年行动计划》等。
尽管国家对算力的一直器重使得算力倒退进入快车道,然而在社会利用层面仍然各式各样的问题亟待技术界、产业界一一解决。例如,在反对 AI 技术的利用方面,GPU 是其中一个要害因素。GPU 善于更高效地解决大量并行的数据和工作,常常与 CPU 搭配应用,以施展各自的短处。
然而近些年,寰球泛滥企业用户却陷入了买不到或买不起的“芯片危机“,以及算力需要一直增长的矛盾之中。因而,企业在面对业务对算力一直高速增长的需要和无限的资源之间的矛盾时,如何高效地施展 IT 设施的算力能力、如何高效地调度算力资源进步应用效率成为了 CIO 必须解决的问题。
得益于近些年同样倒退得热火朝天的云原生技术,尤其是作为云原生技术底座的容器云技术的高速倒退和产业化落地,业界发现,将 GPU 等算力资源容器化、资源池化,能够使算力的治理能力拓展到整个数据中心。这个解决方案将 AI 利用和 GPU 服务器硬件解耦,实现虚构 GPU 资源的动静伸缩和灵便调度,给对 AI、大数据、高性能等计算服务有显著需要的企业解了当务之急。
博云作为国内容器云市场占有率排名前五的惟一守业型厂商,在容器云畛域领有多年的深耕和积攒。博云容器云产品在 AI 利用撑持、高性能计算方面也做了专门布局。
例如,在为国内某高精尖畛域顶级钻研机构建设的容器云平台中,其 AI 利用撑持模块仅仅在上线初期就实现了资源利用率晋升 30% 以上,作业调度能力晋升 60 倍的效力晋升,随着建设的不断深入,效力还在一直晋升。
近日,博云联结在 AI 算力资源池化畛域的领先者趋动科技,独特验证了趋动科技优良的 AI 算力资源池解决方案“OrionX AI 算力资源池化软件”与博云的容器云平台“BeyondContainer”的兼容性、可靠性、稳定性及运行性能。
资源按需分配性能:验证 OrionX 可依据用户理论利用需要按百分比调配 AI 加速卡算力,按 MB 为单位调配 AI 加速卡显存。
资源近程调用性能:验证 OrionX client 容器可在没有配置 AI 加速卡的服务器上运行,并通过 OrionX 应用远端服务器上的 AI 加速卡资源。
多用户 AI 加速卡资源切分性能:验证多个 OrionX client 容器可对同一 AI 加速卡服务器上的 AI 加速卡资源进行切分,同时进行训练或推理工作。
资源聚合性能:验证 OrionX 在用户进行单机多卡模型训练时,可将本地和远端的 AI 加速卡资源进行主动汇聚以满足训练任务对 AI 加速卡资源的需要。
资源动态分配性能:验证 OrionX 反对资源共享性能,当启动 OrionX Client Runtime 对应的 Pod 时,OrionX Controller 不会马上将申请的 OrionX vGPU 资源分配给该 Pod,在 Pod 运行期间,只有 AI 利用在调用 的时候,该局部 资源才会被该 Pod 占用,AI 工作完结进行时,资源即被开释。
单方通过对组件兼容、测试模型和数据集、单机单卡、资源切分、资源聚合、资源排队、资源超分、近程调用、资源动静、算力管制等十个功能测试,验证了 OrionX 在博云容器云平台上的运行状况。测试结果表明单方产品齐全兼容,各项性能运行失常,性能体现优异,通过 OrionX 按需调用、近程调用、资源聚合等能力的赋能,博云容器云平台领有了对 AI 算力资源进行细粒度治理和监控的能力,可在大数据、云计算、人工智能等利用场景中为客户提供牢靠、稳固、高效运行的 AI 算力。
“数字化、网络化、智能化“已成为 AI 行业利用的基本特征,并在一步步促成行业利用向多样化与多元化方向倒退。在智能化时代,“弱小的算力”将成为驱动技术创新与行业高质量倒退的重要引擎。
云原生是解决国家经济建设、社会倒退、科技翻新、国家平安重大挑战性问题的重要伎俩,以升高企业投入老本,进步计算资源应用效率为指标的高性能云计算,将成为数字改革的赋能底座,满足千行百业数字化转型对算力的差异化、定制化需要。
博云与趋动科技在基于容器实现 GPU 资源池化治理方面的联合,将为企业级客户的数字业务倒退提供弱小的助力!
博云公司介绍
江苏博云科技股份有限公司(博云)是国内云原生畛域的翻新领导者,国家高新技术企业,江苏省专精特新小伟人企业。自 2012 年成立以来,专一为客户提供自主可控的国产软件基础设施产品和技术服务,帮忙客户构建面向云原生利用的新型 IT 基础架构,疾速实现 IT 架构变革,以应答新一代信息技术下实现数字化转型的迫切需要。
博云旗下领有容器云产品族、DevOps 开发运维一体化平台和云治理平台三大外围产品线。在云原生畛域,博云容器云产品族提供以利用为核心,以容器云为底座,面向多种利用类型的云原生操作系统,助力企业晋升利用交付效率,加强利用稳定性,实现简化治理,降本增效。博云 DevOps 平台为客户提供企业级“全科技业务域治理”的整体规划、产品交付与解决方案施行。在多云治理畛域,博云一体化云治理平台提供“云纳管 + 云服务 + 云经营 + 云运维”四位一体的中立云治理服务,实现对多云环境的一体化治理、对立云服务提供和精细化经营,帮忙企业高效治理和应用云资源。
博云容器云平台被 Gartner 评为中国 CaaS 畛域代表厂商,市场占有率位列全国前五(IDC 容器软件市场报告);博云云治理平台被 Forrester 列入中国混合云管理软件市场领导者象限。博云 DevOps 平台首批取得中国信通院利用开发域的最高级别的先进级认证。博云产品推出以来,宽泛成熟利用于金融、制作、能源、政务、电信、医疗等不同畛域,撑持了 400+ 家大型企业客户的生产零碎稳固高效运行,为客户的数字化转型保驾护航。
趋动科技公司介绍
北京趋动科技有限公司于 2019 年成立于北京中关村高新技术园区,领有业余的研发、经营和服务团队,被评为 WISE2020「新基建守业榜」最具成长性守业公司 TOP20、「REAL 100 翻新家」、「2021 守业邦 100 将来独角兽」等。趋动科技专一于为企业用户构建数据中心级 AI 算力资源池和 AI 开发平台,趋动科技的 OrionX 猎户座 AI 算力资源池化软件可能帮忙用户进步资源利用率和升高 TCO,进步算法工程师的工作效率。趋动科技的双子座 GEMINI AI 训练平台,为客户提供弱小的 AI 算力治理服务以及高效的算法开发和训练反对,可能化繁为简,帮忙企业建好 AI 平台、管好 GPU、用好 AI 服务。
凭借标准化、可复制的产品架构,趋动科技失去了包含互联网、金融、电信运营商、科研机构和高校等大量行业头部客户的认可。资本市场对于趋动科技的倒退充满信心——趋动科技成立两年多曾经实现近亿美元的融资,顶级的投资机构继续反对趋动科技的倒退,包含国开配备基金、沙特阿美旗下多元化风投基金 Prosperity7 Ventures、元禾重元、招银国内、顺为、高瓴、嘉御、戈壁、讯飞和涌铧在内的国内外顶级 VC 正在见证趋动科技锐意进取的脚步。