关于vr:阿里云张新涛连接产业上下游构建XR协作生态

53次阅读

共计 4246 个字符,预计需要花费 11 分钟才能阅读完成。

2022 年 9 月 2 日,在世界人工智能大会“区块新生 数字宇宙——元宇宙技术与生态单干”分论坛上,阿里云弹性计算产品专家张新涛带来了题为《磅礴算力,同频沉迷》的主题演讲,以下为精髓演讲内容:

大家下午好,我是阿里云弹性计算团队负责异构计算产品的产品经理张新涛。明天我要和大家分享的是:站在公共云的角度如何对待下一代互联网,以及如何去服务下一代互联网。

01 交互降级,形象变具象,沉迷式体验为产业带来改革

咱们认为不论是以后的“元宇宙”名词提法,还是新的技术浪潮,在咱们看来都会把它称为是交互技术的演进。对于交互技术来说其实在过来上百年始终都在一直停顿,特地是近几十年倒退的十分快,它演进也是有方向的,并且也是有法则可循的。咱们看到的是:交互逐步从单向变成双向,从形象的信息变成具象的信息。

艰深的了解,播送和报纸作为传播媒介,都是以文字内容作为次要撑持,很形象,同时也很难可能和报纸背地的作者间接沟通,也就是咱们所说的交互艰难。同理,和一些小说外面的人物去交互沟通,也十分难,因为这都是单向的。然而当初有了交互技术,咱们可能戴着一个 XR 的头盔,就能够在虚构的世界里和任何一个物体、环境、人实现交互,这也就实现了双向的交互。

那么实现了无效双向交互有什么样的意义或者作用呢?其实针对这样的双向交互咱们视之为事实世界和虚拟世界的交融,这个交融也产生了十分多的益处。事实世界是刚性的,很多货色难以扭转,但虚拟世界是柔性的,咱们能够任意定制,当咱们把事实世界和虚拟世界的特色联合起来,咱们就找了另一个解决问题的模型。

举个例子:咱们想要在某地布局一个 CBD,然而无奈精确预估 CBD 建成后对四周交通的影响,从而在建成后造成周边交通拥堵不堪,这种状况在早些时候是时有发生的。而这个时候如果咱们把 CBD 模型放到虚构城市中,同时把所有的交通因素引入,包含汽车、两轮车、行人等,并放进对应的参数加以仿真。咱们就能够预估,在某地建设一个 CBD,哪些地方须要调整批改,最终造成了一个模型。总结来讲:就是把事实世界的问题带到虚拟世界里去仿真找到答案,再从新影响事实世界。

像这样虚实联合的利用曾经十分广泛的呈现在了咱们的生存和工作当中。比方:在生产端场景中咱们常见的各种数字虚拟人,元宇宙演唱会,沉迷式数字博物馆,企业端场景中的各种虚构仿真零碎,数字孪生工厂等等。目前次要的沉迷式利用或者叫做视觉计算利用次要是在这两个比拟大的场景里,总结而言带来的劣势是:在生产端畛域给大家的生存带来的是美妙和乏味,在企业端畛域带来的是创造力和生产力。

这些如此多元宇宙利用的出现,是须要云计算的,咱们看下这些利用对云计算的挑战有哪些。

02 阿里云,冲破产业链挑战,买通商业合作

在咱们看来这场新的产业变革是影响到全行业的,所有的元宇宙利用或者视觉计算利用都能够应用这个模型来示意。开发者开发的元宇宙利用,须要通过云端计算能力并借助人机接口设施将虚构体验带给用户。即使看上去如此简略的模型,在产业理论的落地过程中也面临微小挑战,挑战的起因来自三个方面:元宇宙产业的技术栈异样简单,要影响到的行业泛滥,潜在的用户也是泛滥。最终带来两个比拟大的挑战:技术上的挑战和商业合作上的挑战。

先来看技术上的挑战。

技术方面的挑战次要是计算方面的挑战。过来 20 年大家都经验了从 PC 到手机的转变,最重要的变动来自于交互方式的变动。大家的交互从 PC 时代的鼠键 + 显示器到了当初多点触控的形式,甚至是在 XR 头盔和眼镜上应用了手势和语音的交互,这些交互须要更多的计算能力,然而终端的计算能力演进速度却日益顾此失彼,交互计算负载开始逐步向数据中心挪动。

在过来 20 年间,数据中心的计算力规模扩充了百倍,这外面除了互联网用户增量带来的增量变动而外,剩下是交互方式带来的计算增量,最显著的变动是数据中心呈现了异构减速计算。例如:咱们常见的手机上的语音辨认,购物举荐,刷脸领取,AI 相机等等,都须要借助云端 AI 计算资源帮助。到了下一阶段的 XR 终端更是如此,咱们来看看 XR 阶段有哪些计算需要。

当初到了 XR 阶段,对计算的需要更加强烈,甚至是过往需要的数百倍。

比如说在 XR 的场景下就会有三类计算:图形图象计算的挑战、AI 计算的挑战、流媒体计算的挑战。图形计算须要始终实现实时的图像生成,AI 须要更多,实时对话,实时画面面部表情变动,实时的情绪辨认与生成,这将面临微小的计算增量挑战。除此之外,咱们把内容从云端传到用户端,从用户端传到云端的过程中还须要另外一个货色——通信,它须要十分大的带宽以及非常低的延时。

总之,计算力的晋升要数百倍,通信的能力的晋升也要数百倍。

咱们再看一下商业合作的挑战:元宇宙这个新兴产业的技术栈十分复杂,实质上源于其应用了过来几十年人类成熟和正在演进的所有 IT 技术。这也导致新产业的商业合作链路非常简短。咱们在过来一段时间对产业进行了认真梳理,将产业模型逐步简化到五个环节,目前绝大多数客户和搭档都在这五个环节中。后面有一个嘉宾提到,做一个数字人、虚拟空间等要多少钱,这两头最大的问题是大家的合作效率极其低,使其老本很高,成果也并不现实。如何让大家效率晋升,同时做出更多有用的货色,这才是咱们的亟待要解决的商业合作的问题。

探讨完了商业合作上的挑战,咱们来看一下技术问题怎么解决。技术问题后面讲有计算力的挑战,还有一个计算规模的挑战,除此之外还有一个通信的挑战。阿里云过来多年做了神龙计算平台,明天咱们降级到 CIPU 的平台,目标就是为了解决计算性能,通信能力上的技术挑战,除此之外,咱们在过来几年 GPU 实例的计算也减少了百倍来应答 AI 和图形计算的挑战,GPU 计算资源的规模也超过了 1700P。

这页能够看下第四代神龙计算平台带来的计算和通信能力的晋升体现。

这页来看下当初降级到 CIPU 之后,带来的规模,稳定性和弹性的微小劣势。

这页是咱们去年公布的第七代 GPU 实例,这个实例在 AI 计算和视觉计算性能上都有了显著晋升,并且反对第二代实时光线追踪引擎,是个非常适合元宇宙业务的计算实例。

尽管看上去技术挑战依然十分艰巨,然而咱们找到了方向,这样实现冲破也就绝对容易。然而更大的挑战是是商业合作。

商业合作如何买通?大家可能认为云计算厂商就是提供计算力的,实际上咱们认为这对云计算厂商来说这远远不够,为什么远远不够?因为云计算有着十分大的劣势,连贯需要的上下游,能把所有的需要在这里连通,并且帮忙大家做得更好。

因而,咱们除了把本人的 IaaS 产品做好之外,还心愿把整个产业链后面讲的那五个合作环节高效起来,进而就有了合作体系。这个合作体系次要是分为三层:其中之一是咱们会把产业里的共性问题在接口层这里解决掉,比方:晋升 3D 引擎的渲染效率和能力,晋升编码和串流的能力等等;进一步地,咱们和搭档单干搭建起来合作平台,咱们心愿应用这个平台将之前讲到的简单的合作变得高效起来;最初,咱们还面向全行业构建行业编辑器矩阵,或者行业 SaaS 矩阵,通过低代码的形式让更多行业能够构建本人的元宇宙利用。

这里咱们先来简略介绍一下合作平台的两个产品:云 3D 引擎编辑器平台和云 XR 平台。

对于合作平台后面很多嘉宾讲到 3D 引擎,其实 3D 引擎在这外面起了一个十分枢纽的作用,所有的游戏,元宇宙的利用,3D 的利用,都要用 3D 引擎来开发,用 3D 引擎的编辑器来开发。然而 3D 引擎实际上还是有门槛的,无论是技术上的门槛,还是计算力上的门槛,还是整个商业合作环节上的门槛都十分大,可能每一个这种利用都须要带上几百 G 的素材,也就相当于带上一个十分微小的计算量。

比如说咱们做一个货色,做一个烘焙,可能几十个小时就过来了,开发者就要等几十个小时,效率非常低。咱们是心愿用云的形式来解决,大家能够在各种类型的终端上进行业务开发,开发环境不受限制,计算资源也不受限制,这样开发效率就大大晋升了。

03 云 XR 平台公布,反对用户高效部署,落点沉迷式利用

那么开发进去的货色部署在哪里呢?其实咱们公布了一个云 XR 平台,这个平台能够反对大家把各自的利用开发进去后间接放到这个平台上,不须要像之前一样开发进去的利用,适配成千盈百的这些终端,效率十分高,可能 5 分钟就能够搭建实现一个云上的元宇宙利用。

对于云 XR 平台大家可能会比拟关注的一些特色,如:OS 类型,引擎类型,终端类型的反对状况,咱们也实现了对 nReal 眼镜的反对,欢送大家试用。

大家可能关怀对开发流程的影响,基本上无任何影响,你无论是 2D 的利用开发还是 3D 利用开发,都与过来没有太大区别。

最终无论是在云下来创作开发,还是在云上部署,大家环节是没有变的,以及其实咱们在云上也落了很多这样沉迷式的利用。

上图是咱们客户的一个元宇宙演唱会,作品内容出自咱们的合作伙伴。这是在 9 月 4 号他们举办的元宇宙演唱会的一些画面的成果,就是在云上实时渲染进去的。我后面讲了汽车产业,其实这些沉迷式的利用或者是叫视觉计算利用,实际上曾经能帮忙很多产业来解决问题。

举个例子,当初最热的产业之一:主动驾驶,然而主动驾驶大家会发现有个微小的问题,它须要上百亿公里的路测,但中国的当先企业,可能只有几千万公里的路测,起步较晚的企业路测里程更短。同时这些路测的老本也十分地昂扬,须要买几千上万辆汽车,雇几千上万个司机和安全员去做各种各样的路测,且这个积攒的数据量也相当地无限,然而如果咱们把它在虚拟世界去做仿真,这个成果将是极其地疾速,咱们可能说在云下来开数万个 GPU 实例,用数万片的 GPU 去渲染进去这样的场景,咱们是用数万台虚构的汽车去跑,而且是 24 小时不停地跑。

因为虚拟世界的柔性可定义,能够定义进去各种路面,光照和环境,这就是使得检测进去主动驾驶程序的各种 bug 的概率,比在实在路测的条件下要高很多,这是能够侧面进步生产效率的。

除了主动驾驶,衰弱产业咱们同样关注。这是咱们一个合作伙伴,他们做了全世界最先进的医学数字人,他们的一大部分的钻研方向是钻研人体,其实当初很多医学院、医院都须要这样的人体模型,来做术前钻研布局,学习等。

咱们通过视觉计算的形式,很轻松的就能够把这种服务投递给每个须要的机构或者集体,帮忙他们高效实现钻研和学习的目标。

用交互技术辅以磅礴的算力带给大家最实在的“沉迷式体验”,突破技术 + 商业合作的双向挑战,买通产业上下游,助力其实现高效,置信是每一位同仁们的愿景和指标,也心愿终有一天,咱们可能看到交互技术真正为全产业的全链路带来新的产业机会。

我的分享就到这里,谢谢大家。

点击这里,理解阿里云视觉计算解决方案。

正文完
 0