4 月 21 日,“2022 英伟达数字孪生技术利用论坛”上,阿里云弹性计算产品专家张新涛为大家带来了题为《阿里云弹性计算在 XR 业务上的利用实际》的主题分享。
以下内容依据他的演讲整顿而成。
01 从云计算开始,触摸视觉计算
2019 年阿里云北京峰会上,阿里云与咱们一个重要合作伙伴一起公布了一款新的图形 GPU 计算实例 vGN6i,演示的场景是模仿一位购车用户通过支付宝小程序接入到一个真切的汽车试驾 3D 空间,这个 3D 汽车和驾驶空间位于云上,购车用户在平板电脑上实现了这次试驾体验。这也是阿里云弹性计算业务最早接触数字孪生客户场景。单干过程中咱们也逐渐意识到数字孪生是晋升全社会创造力和生产力的关键技术,之后咱们便十分明确地加大了针对图像和流媒体相干产品与技术的投入和积攒。于是,工夫到了 2021 年,此时“VR/AR/MR”这些概念再次流行起来,甚至变得煊赫一时,业界曾经发明出了各类“Verse”来形容概念,然而在咱们看来目前仍然处在 XR 的视觉计算阶段。
阐明:VR/AR/MR 在实现的人机接口上有较大不同,然而利用场景重叠度较高,业界统称 XR。
作为阿里云最早触碰“XR”和 ” 数字孪生 ” 的产品团队之一,咱们也在外部开始与各个团队分享针对 XR 产业新浪潮上的见解,上图是 2021 年 8 月,“AR/VR/MR”以及各 Verse 正当炽热,咱们为外部团队解读 XR 产业时的其中一页,那时候咱们的认知角度次要站在新产业热点对全行业影响的认知上。XR 作为新的信息交互方式大家都满怀期待,然而如何通过云计算赋能到各个行业呢?产业的配合关系是怎么的?产业体系中,对每个参与者的需要是怎么样的?云计算在其中要奉献什么样的价值呢?咱们不晓得,然而咱们更加踊跃的在业务实际中去思考和摸索。咱们过后提了一个概念:视觉计算打算,8 个月后的明天,咱们又有了新的视角。
咱们借助网上十分风行的“‘Metaverse’产业七层体系图”阐明产业体系,顺便也看云计算要在其中承载的社会价值。能够看到图中是从最靠近 C 端用户的体验场景需要,始终延长到产业的最顶端尖端基础设施技术的需要,相比于过来每一次信息产业的改革,这次尤为简单。从图中咱们也能领会到,XR 及各类 Verse 是利用人类已有和将有的技术加之商业伎俩实现对人类感官体验进行全方位降级,并且通过这次的降级浪潮实现全行业创造力和生产力的一次重大飞跃。
当咱们把左图中的产业需要映射到右侧云计算专一晋升并能够奉献价值的畛域时,咱们发现这 5 个畛域是云计算必须冲破和面临挑战的畛域,这次是产业需要对云计算的全方位挑战。
02 阿里云超强算力迎接 XR 及 X -Verse 的产业挑战
这 5 个方向的挑战其实也是相互影响的,牵引方来自于利用交互体验降级需要,在交互体验实现飞跃的需要下,利用会应用到更多的人机接口形式,这间接导致计算、通信的复杂度剧增,并且还要兼容如此多的交互方式,而这些还都是技术面的挑战。更大挑战来自于产业生态,咱们如果期待这个新交互体验的降级产生,则须要一套与之匹配的经济生态来驱动,这与以往的每一次 IT 技术革新带来的商业生态改革一样。
咱们重点来说下牵引方:利用。晚期的人机界面是纸带和打孔机,现在咱们最罕用的智能手机曾经能够通过 2D 图像、声音、指纹、手势、红外、摄像、触屏、声音、触动、随身传感器等与咱们进行交互了,而更加先进的手势辨认,触感手套也开始小规模商用了。而现在应用程序的开发,相比纸带期间简单了数万倍,利用笼罩畛域扩大了数万倍,对计算和通信需要晋升了数万倍,背地反对的经济规模也扩充了数万倍,开发者数量更是大幅扩增,其实前面所驱动的是一个微小的产业生态。
因而,这次咱们遇到的 XR 及各类 Verse 仍然如此,这不是一次简略应用 XR 设施代替其余终端的变动,这是一次产业革命。
为什么说是产业革命,因为以后的技术能力和商业模式还无奈反对实现咱们现实的那个数字虚拟世界。举个例子,咱们当初业界还无奈应用 AI CG+AI 驱动 + 物理引擎的形式实现一个齐全意义的虚拟人,其中很大限度来自于计算能力有余,带宽和延时的挑战仍然存在,以及如何组织一个集人类信息技术大成的开发团队来实现。
那么定义到问题层面,咱们在计算性能和规模,通信带宽和延时,生态效率与凋谢水平上都有一个飞跃。
计算上,须要相比以后 10 倍以上的计算性能和计算规模来解决产业的几个要害的计算问题,例如:更高性能的 AI 训练和推理,更高性能的实时光线追踪,更高性能的编码。
通信上,同时须要十倍以上的通信性能来解决通信带宽与通信延时的问题,以便辅助高性能的异构减速计算,实现云与端的无缝协同。
生态上,更须要一套建设一套开发者合作体系和商业生态来发明能够影响到千行百业的开发者生态系统。咱们在后面很多年都在解决前两个问题,而目前正在解决第三个问题。
在过来的几年工夫里,阿里云通过神龙架构、GPU 实例迭代,翻新 GPU 超算集群等计算和产品伎俩来解决计算和通信性能挑战的问题,通过大规模 GPU 产品商业化经营来解决 GPU 算力规模的问题。
在 2021 年云栖大会公布的第四代神龙架构在 IO 上也持续实现了性能和性能上的微小飞跃,实现了 eRDMA 大规模组网,并且把时延升高到最低 5us,并且网络 IO 应用硬件加速实现;VPC 网络能够实现 5000 万 PPS 的吞吐和 16us 低延时通信。这意味着尔后实现的虚拟人能够辨认人类的更加轻微的表情并且能够实现虚拟人的轻微表情展示。
2021 年咱们还公布了第七代 GPU 实例,无论是 XR 及各类 Verse 用到的大规模多模态模型训练和推理,还是实时 3D 渲染,实时光线追踪,性能均实现大幅增长。
在计算规模层面,截止到去年 5 月,云上的 GPU 总算力曾经超过 1000PFLOPS,并且仍然在高速增长,这也将成为咱们将来创立数字虚拟世界根底算力池的一部分。
尽管计算性能,通信性能,计算规模都实现了大幅度增长,然而生产关系与生产力的问题仍然存在,咱们须要建设一个相适应的合作生态体系。
03 继续翻新为全社会输入松软算力
发达一个行业,就要翻新生产力和生产关系。咱们心愿借助云上的技术、产品和商业生态来实现,阿里云的基础设施多年来在逐步完善,一直为全社会提供更多优良的 IaaS 产品,但在异构计算层面,还须要做更多。
异构减速计算通常难以使用的,这个置信每一个应用 GPU 或者 FPGA 做开发的开发者都有同感,咱们在过来服务客户的实际中,通过翻新的软件和云服务来逐渐解决这些问题。
例如:咱们为晋升用户 GPU 计算中 GPU 的应用效率推出了 AIACC 来帮忙用户减速,在诸多大规模的 AI 训练和推理场景中,通常会有 50% 到数倍的减速成果,帮忙用户升高 TCO。咱们还通过 Windows 渲染容器的形式来解决实时渲染场景下的 GPU 计算弹性共享的问题等等。
用户的共性问题咱们通过代码来解决,且逐步积淀为解决全行业问题的平台工具和软件。以后借助各畛域合作伙伴的能力,在阿里云的软硬件产品之上共建了解决全行业问题的生态产品,这是咱们正在做的。根据长达一年的全行业沟通,咱们把全行业的需要分为三层:通用层、行业层、生态层。
◾ 通用层:通用层是提供更加原子化的能力来帮忙全行业在云上构建业务,比方:云 XR 平台和云 3D 编辑器就是这一层面的要害产品。
◾ 行业层:对于行业层,咱们的指标想法是为各行各业提供能够晋升全行业生产效率的编辑器工具,通过编辑器工具,各行各业更加简略、高效地创作出适宜本行业的 XR 及数字孪生利用,通过这种形式来赋能全行业。咱们也向全行业收回邀请,心愿致力于解决某个行业潜在问题的搭档可能与咱们开展单干,目前咱们在这里积攒了十分多的搭档,他们领有一流的产品,正在帮忙很多行业创立本行业的 XR 及数字孪生利用。
◾ 生态层:生态层尤为重要,如果将行业层比作火箭的话,那生态层就是火箭的燃料,各行业在建设本行业 XR 及数字孪生利用时,须要大量的素材与数据资产,如何高效发明和应用这些数字资产显得尤为重要,也是凋敝开发者社区的要害一环。
在构建这些能力的同时,咱们仍然会坚固咱们的 IaaS 产品,并且将其做得更好,咱们会在根底产品服务上判若两人地给咱们的客户提供继续的优质产品和服务。
咱们再聚焦到产业看需要。上图中有一个常见的利用场景,在媒体上这个常常与咱们了解的 XR 及各类 Verse 概念是绑在一起的,而对以上场景目前的认知也还在视觉计算的领域,这些场景来自于不同行业,帮忙行业发明新的业务需要或者做生产力优化。尽管这些场景目前看上去极为简单,然而当咱们站在视觉计算的角度对以上场景做归一化时,最终依然会落到咱们曾经定义好的产品能力板块上了。
上图是我要重点介绍的要害产品局部之一:云 XR 平台。
云 XR 平台是以后最为间接将云、XR 及数字孪生利用和 XR 终端链接起来的平台服务,云 XR 平台能够通过云与利用,云与端的标准接口实现事实上的产业规范对立,这一点对于产业倒退有十分大的意义,对于供应侧,大家在约定好的接口上开发产品,实现互操作,效率更高,而在利用侧,用户也不会放心供给侧的任何变动和降级会导致之前的投入不可用。
咱们曾经在这个平台上为国内某高校客户实现了云上的热工仿真实验室,学生能够在 PC 端或者平板上实现对发电厂各类能量转换安装进行仿真试验,比方:操作汽轮机做试验,操作变电站做试验等等;咱们也与翻新的虚拟人客户实现了云上数百人加入的虚拟人演唱会等等。以后曾经有越来越多的产业和行业开始尝试用云端 XR 形式做业务翻新和产业降级,同时咱们还在推动这个产品为更多行业赋能。
04 各行各业如何落地云端 XR 业务?
这里就引出了咱们另一个基于生态搭档的平台产品:云实时 3D 编辑器平台。
如大家所相熟的,咱们开发不同平台的软件,就须要不同平台的代码编辑器、代码编译器,开发 XR 平台上的应用软件,咱们就须要实时 3D 的编辑器。然而,要应用这类软件并不容易,开发者须要购买低廉的高性能 GPU 工作站硬件,还须要购买实时 3D 编辑器的低廉受权,这对于开发者,都是一笔极大的开销。与此同时,这类的大型利用,通常须要一个团队来实现,就须要随时协同开发,并且开发过程中,诸多计算环节极其耗时,受限于 GPU 工作站的计算能力,开发者只能期待。
因而,咱们与国内顶尖的实时 3D 编辑器软件供应商正在推出联结产品,以便将实时 3D 的开发环节也搬到云上,这样开发者就能够在无任何环境依赖的前提下,疾速开展业务,实现跨地区协同,并且实现耗时计算的疾速计算。