关于元宇宙:虚谷未来CEO-唐佳娴让虚拟人灵-动起来

图：2022 阿里云视觉计算私享会现场

5 月 11 日，在“2022 阿里云视觉计算私享会”上，数字王国团体虚谷将来科技 CEO 唐佳娴为大家带来了题为《让虚拟人“灵”动起来》的主题分享。以下内容依据她的演讲整顿而成。

2008 年，数字王国首次翻新“虚拟人”技术并使用于电影《老态龙钟》。2012 年，咱们首次将虚拟人搬上舞台，在科契拉音乐节“复活”已故美国饶舌歌手 Tupac，轰动全美。尔后，2014 年，咱们在亚洲市场“复活”了邓丽君。2018 年，咱们展示了具备业内当先劣势的高拟真虚拟人 DigiDoug。

在虚拟人倒退的晚期，个别须要借助虚拟人的模型，加上前期特效来实现整个虚拟人的出现。到了 2019 年，咱们实现了所见即所得、实时渲染的高画质虚拟人。

基于这个转折点，咱们更多地将此技术落地于商业利用，有与芝加哥博物馆单干的复活马丁路德金，也有国内市场的班长小艾等一系列角色。

虚谷将来是数字王国做虚拟人商业化的业余公司。在近两三年的理论摸索中，咱们发现，除了高品质虚拟人的制作须要丰盛的技术教训，在虚拟人市场利用技术也十分有必要匹配相应的解决方案，从而实现虚拟人“高品质、轻利用、低成本”的商业落地。咱们专一将虚拟人的制作、利用、经营全栈一体化倒退，实现虚拟人日常高频次、量化产出内容，提供为各品牌、机构的高性价比服务。

上图是虚拟人动态模型，包含卡通、2 次元、2.5 次元及风格化、游戏级、拟真人、写实级、电影级 7 - 8 档。

动静模式次要有以下三类：

动画：依附传统特效，包含全 3D 以及真人实拍加局部 3D，这是传统特效的利用形式。

人力动捕：由真人穿戴业余动捕设施，通过光学捕获和惯性捕获来驱动模型。次要考验 3D 模型资产的绑定以及驱动的算法能力及教训；另外，还有通过视频相机捕获真人表情、动静的形式，做模型的驱动，比拟便捷，便可驱动的模型精密级别无限。

算力动静：不须要真人动捕操作，虚拟人的面部和身材动静、语言表达全都通过 3D 数字化操作。例如，咱们与跟阿里达摩院单干的虚构主播齐全利用数字化驱动；除此之外，还有用 2D 真人照片、视频的模式，次要解决口型和绝对固定局部身材动作的动静出现。

上图展现了真人拍摄 + 换头特效的形式。在日常经营中，虚拟人与简单空间、人物同框交加的视频须要，以及立体物料变动丰盛的服装，大多采取此种形式实现。

上图左侧展现了人衣着业余动捕服来做数字人的驱动。右侧为通过相机、电脑摄像头捕获真人表情及动作，从而操控虚拟人，多利用于虚构角游戏级别以下的虚拟人。

上图为算力驱动，也是数字王国虚谷将来与阿里达摩院单干的我的项目。上图中主播的身材、表情和语言全副通过数字驱动出现，它还接入了淘宝客服零碎，可能主动发放优惠券、答复观众发问。因而，虚构主播与真人主播是十分好的搭档。白天真人主播上线，24 点后虚拟人主播可设置主动上线直播，大大降低了人力老本，进步品效；对直播间的权重以及产出来说，是十分优良的组合。

算力动静的 2D 建模，应用真人照片的面部合成为新的虚构脸型及身材形象，次要集中在口唇部的动静及简略身材动静的配合，利用老本绝对低，但虚构感会绝对弱。

AI 智能化包含 2D 真人照片、各类级别的 2D/3D 虚拟人，能够分为两类：

第一类：固定的常识图谱加上固定的声音、表情、动作组合。常识图谱是零碎设置好的声音、表情、动作，由虚拟人去执行设定好的内容，实现去人化 AI 动静。

第二类：更高级别的常识图谱，虚拟人能够通过算法进行学习，包含表情、动作的动静和语言内容，最终实现的成果是虚拟人所有的体现和思考、表白都通过虚拟人自我学习达成，是一个真正的 AI 智慧人。

上图为数字王国超写实虚拟人 Digi Doug 与实在人类进行互动，他的声音、表情动作、表白都是通过本人学习而成。

数字王国虚谷将来始终以来，专一于高品质虚拟人的制作和经营，而业内的其余搭档也都在各自的细分畛域里精耕细作。依据不同的利用场景，使用不同的虚拟人制作和利用模式才是最佳组合。心愿业内的搭档们一起联结共创以及合作。

比方市场物料的立体和视频，能够通过动画特效与实景或全虚构景联合，能呈现出更精质的大片成果；虚拟人直播能够通过优质的虚拟人实时驱动技术 + 中之人的体现，使虚拟人更具人性化和亲和力；在自媒体经营、短视频的场景利用，须要便当、低成本、高频次地输入内容，更多也是利用这种模式。而虚构客服能够使用全 AI 的模式为客户提供最低老本的 24 小时实时服务。

将来，虚拟人的两个发展趋势肯定是高品质的表现力以及智能化利用。

而高品质的规范有三：

第一，精密、超写实的画质。
第二，可能高灵便度地操控表情、动作、材质等。
第三，实时渲染，即，实时实现前两项高品质、高灵便度的实时驱动。这是比拟大的挑战。

数字王国虚谷将来的虚拟人，已实现了电影级虚拟人面部表情的实时灵动，包含眼球级的实时灵便追踪。

上图，虚拟人艾博爷爷脸上的皱纹细节、眼睫毛粗疏真切，具备超写实质感，出现了电影级的写实水平，且实现了实时渲染。这些优良的体现都源自于数字王国数字王国独特的虚拟人实时式驱动零碎。

除了表情和动作，服装的动静算法也至关重要。比方班长小艾的双层纱裙，动静下能出现十分灵动飘逸的质感，十分考验材质的算法。

咱们于 2019 年在温哥华 TEDTalk 首次实现了虚拟人模式演讲，全程由自己实时操控虚拟人实现。

因而，数字王国的核心技术就是实时动捕驱动虚构零碎。

以上为数字王国虚谷将来的虚拟人案例。

目前虚拟人在大娱乐、快消、客服类和近期疾速倒退的数字 NFT 畛域，尤其 NFT 青出于蓝，虚拟人曾经成为所有品牌方利用的重要模式。

让一个虚拟人灵动起来，包含灵便的动作和灵魂，虚拟人的灵魂须要通过内容输入来表白。因而，便捷和量产十分要害。利用上来看，不论是直播、视频还是实时流动，高品质、轻量级以及低成本十分重要。如果须要破费很长时间和高制作老本能力输入一条视频，不利于虚构 IP 的打造，不能满足日常化利用的理论需要。

目前咱们的零碎曾经可能实现一台业余电脑，加一个技术人员和一个中之人，即可实现整场直播的体现输入，完满解决自媒体和品牌方的需要。

虚拟人还能够利用到产品包装、流动公布、上演等场景，通过 AR 技术实现互动、通过线下全息类安装实现虚拟人沉迷式展现和服务，通过 XR 的形式来出现的线上 / 线下发布会、综艺表演也十分精彩。

以后咱们正处于 web 3.0 的初始阶段，它更是一个品牌数字营销的降级关键期。因而，品牌领有一个虚拟人或集体领有一个数字分身是大势所趋，因为这是进入元宇宙、新数字化营销的根底。

心愿在不久的未来，通过业内各搭档的单干，每个品牌可能疾速领有专属的高品质品牌虚拟人，每个人都能领有本人的集体数字分身。

点击这里，查看本次视觉计算私享会的回放视频。