关于web:Web30时代-数字人如何突破规模落地三大难点-百度李士岩两年内每个人有望实现数字人自由

100次阅读

共计 2325 个字符,预计需要花费 6 分钟才能阅读完成。

刚刚过来的 2021 年,元宇宙概念爆火到一度“出圈”成了顶流。在寰球科技巨头纷纷下场、web 3.0 减速构建的过程中,虚构数字人作为元宇宙的场景入口与连贯纽带也备受瞩目。刚刚举办的江苏卫视跨年晚会上,周深与邓丽君跨时空独唱《大鱼》在全网刷屏。面对数字人展现出的泛滥可能性,2022 年 1 月 14 日,百度科技沙龙《AI 呀,我去!》第四期以数字人为主题,为百余位媒体、专家学者展示了数字人产业的全景。

本次流动上,百度智能云 AI 人机交互实验室负责人李士岩基于多年教训,围绕以后数字人产业的倒退格局、技术难点和底层驱动力进行了零碎分享。李士岩示意,虚构数字人产业格局中,提供建模、渲染、动静捕获等服务于数字人制作的基础设施服务商已造成巩固格局,大多由海内巨头把持,但在工具、应用层,中国企业已开始锋芒毕露。

尽管如此,数字人规模化落地还面临三大难点:产业链割裂、服务场景与演艺场景没有无效买通、满足高频需要老本高。为零碎解决这些难题,百度推出数字人平台“曦灵”,将来数字人生产、内容创作、业务配置服务将能够在一个平台上实现全链路制作和调优,降本增效。“咱们近两年的奋斗目标是,通过百度智能云曦灵平台的凋谢,让每个人实现数字人自在。”李士岩示意。

数字人大规模落地要冲破三大难题

目前,数字人经验了以“纸片人”为代表的 1.0 阶段,以 Vtuber 主播为代表的 2.0 时代,已进化至 3.0 阶段,具备模型高精、人工智能驱动特点的数字人 3.0 成为行业支流。李士岩介绍,第三代数字人的建模和内容生产均有 AI 参加,这使得数字人的制作效率更高,也更智能,能面向更多利用场景。可面向全群体用户,可由视频、直播、chatbot 等载体承载,更具备千人千面的互动能力。

现阶段,数字人 3.0 已展现出微小的市场空间。依据次元光谱不齐全统计,2021 年国内虚构偶像 / 数字人畛域里至多产生 19 笔融资,2021 年产业上下游也纷纷从本人善于的角度切入市场。虚构数字人产业格局中,提供建模、渲染、动静捕获等服务于数字人制作的基础设施服务商已造成巩固格局,大多由海内巨头把持。不过,在工具、应用层,中国企业已开始锋芒毕露。

中国企业中,数量最多的是资产制作和策动经营类的公司,比方推出超写实数字人的 AYAYI 燃麦科技,推出虚构人物柳夜熙的创壹视频,但这类公司面临的挑战是门槛较低、可替代性高。此外,把握技术和场景的互联网公司则表演综合性技术服务商的角色,一边推出基于本身劣势场景的数字人,打造利用标杆;一边推出数字人平台,将产品持续落地到更细化的场景中,点、线相互推动。

李士岩示意,数字人产业有三大外围推动力,第一级火箭是用户需要与技术升级、第二级是政策反对与资本涌入、第三级是计算平台的迭代 ——“每一次数字人倒退实质上都是技术推动的,用户从立体的图文影音获取信息与交互,向实时 3D 交互反馈的需要转变,将成为数字人长期倒退的基本动能,将来也将发明大量需要。“

尽管数字人行业领有强劲的驱动力,但李士岩认为,当下国内数字人要大规模产业落地还面临三大难题。

首先,数字人产业链各个节点绝对割裂,不能高效协同,导致数字人在制作和调优上存在较高壁垒,目前行业中大多数公司只是数字人制作与经营全流程上的一环或其中几环。其次,服务场景与演艺场景没有无效买通,体现为演艺型数字人不具备客户所需的业务能力,而服务型数字人不足人设,难以与用户进行情感交换。第三是满足高机动性、高频需要的老本仍旧很高,这一问题归根结底还是数字人的生产效率问题。

百度推出数字人平台“曦灵”

面对以后数字人制作的高门槛,在 2021 年 12 月底举办的百度 create 大会(百度 AI 开发者大会)上,百度 CTO 王海峰正式公布了“百度智能云曦灵数字人平台”,搭建集数字人生产、内容创作、业务配置服务为一体的平台级产品。目前该产品已具备规范平台的疾速交付能力,帮忙不同畛域客户疾速实现麻利型需要,降本增效。百度的数字人平台曦灵具备全场景、一站式、平台化的特点,能反对从最后数字人形象定制、人设治理再到业务编排、内容创作,最初到多种驱动模式下与用户互动的全副需要,这也意味着在一个平台上即可实现数字人的全链路调优,从而将成果做到最好。

李士岩以数字人生成环节为例,演示了百度智能云曦灵平台的性能。用户在百度智能云曦灵平台上传一张照片,就能疾速生成一个可被 AI 驱动的 2D 数字人像,以前须要两三个月工夫做进去的 3D 数字人,当初能够压缩到小时级,同时还能够通过一句话语音形容或简略捏脸等多种形式疾速生产数字人。数字人个性化性能开发也较之前更加欠缺,以百度刚刚公布的 3D 超写实书面语数字人为例,其口型合成准确率高达 98.5%。

在技术催生的数字人 3.0 阶段,虚拟人可与不同行业产生更严密的交融。基于市场应用场景,数字人能够分为演艺型数字人、服务型数字人两类。

演艺术型数字人包含虚构主播、虚构偶像以及数字孪生的虚构品牌代言人。目前百度曾经打造了 AI 手语主播、央视网虚构主持人小 C、航天局火星车数字人祝融号、百度虚构代言人希加加、百度 APP 代言人龚俊数字人。

服务型数字人包含数字员工、虚构员工、虚构业务员等,能够帮忙金融、运营商、政府、批发等行业提供基于数字人的新一代客户服务能力,解决排队长、回应慢、人力老本大等问题。目前,百度曾经和浦发银行、光大银行、中国联通单干,推出了一对一服务型数字人。

百度在数字人技术上的冲破,得益于其在行业内的继续布局。早在 2019 年,百度就开始了“虚构数字人策略”。基于多年的 AI 技术积淀,AI 能力已成为百度智能云曦灵平台的外围能力,当初百度也在把这种能力凋谢给外界。李士岩示意,“咱们近两年的奋斗目标是通过百度智能云曦灵平台的凋谢,让每个人实现数字人自在。”

正文完
 0