摘要:互联网视频通过几代倒退,用户体验疾速降级,对翻新玩法、互动性要求越来越高。那如何解决这些问题? 媒体AI,是行业共识。华为云提供云原生实时媒体AI能力,联结搭档打造AI算法凋谢生态市场,减速视频业务翻新,云端特效就是其中一个用例。

随着视频业务一直降级,用户对体验的要求越来越高,比方要互动性更强、玩法更多样,体验更酷炫等。另外,直播业务、RTC业务,内容同质化比较严重,内容发明、用户体验也都遇到了天花板,这些都须要一些技术去突破它。华为云跟斗鱼长期碰撞,独特摸索后,失去一个命题:通过媒体AI去做这个事件。当初的直播视频外面有很多直播特效,包含像美颜、美型、虚构主播、背景替换等,同时华为云面向在线教育的场景,也会有一些像课堂评测的能力,都是基于媒体AI去做的。

构建媒体AI目前面临的三大痛点

以后,媒体AI的构建有几大痛点:

1. 终端:类型多、算力弱。

目前很多的媒体AI能力都是在终端实现的,尽管终端的算力在一直晋升,但像一些高复杂度的特效是做不了的,比方虚构人物。背景替换以后的成果也很个别,你能看出一个显著的轮廓,当然更不要说实现对标电影级特效的背景替换了。

2. 云端:实时互动弱、老本高。

当初很多在云端去做的视频AI,个别都是偏差于离线的业务,它对互动体验的满足性绝对比拟低。在直播实时互动的时代,这是无奈满足需要的。而且因为音视频数据在边缘和云端源站互相传输,引入较高的带宽老本。

3. 翻新门槛高、生态关闭。

当初AI的能力,各厂家都是独立开发,各玩各的,生态绝对是比拟关闭的。

华为云心愿基于云原生,和搭档一起构建一个边云协同的实时媒体AI的能力,去解决上述痛点,减速视频业务翻新。

实时媒体AI的定义及外围价值

华为云给实时媒体AI做了一个定义,基于华为云原生的边缘、计算、容器、存储、网络等服务能力,构建丰盛的实时媒体AI解决能力,同时联同搭档打造生态凋谢的AI算法市场,减速视频业务翻新,为客户提供差异化竞争力,为用户提供更优质的体验。

先举个简略的例子,咱们把以后直播和RTC里端侧做的一些特效,通过边缘云的形式来实现,退出更多更酷炫的特效,比方成果更好的背景替换,晋升互动性的AR卡通、虚构人物等等。

以后,实时媒体AI还处在一个摸索推动的状态中,咱们心愿其能实现如下4个外围价值:

1. 玩法更多。当前直播和RTC业务有更多的AI能力能够用,能够组合,来实现更多更酷炫的翻新玩法;

2. 体验更优。有了这些翻新玩法后,用户对实时互动的体验要求是比拟高的,咱们心愿实现“提早无感”的体验,与本地应用高端机是同样的体验成果。还有一点针对算法开发者来说的,能够基于云的平台,更快地公布、更快地开发,更快地去体验验证。

3. 老本更低。目前大部分媒体AI的能力是基于端侧实现的,因为一提到云侧,就会想到GPU、各种硬件平台的老本会比拟高,但咱们心愿能把这块的老本降下来。这里包含两个局部,一是用华为云对立的软硬件资源,进步资源的复用率,升高每一路资源老本,二是基于云上对立平台,一键更新,无需适配多种终端,来升高算法开发和APP更新的老本。

生态凋谢。咱们心愿构建一个凋谢的AI算法生态市场,防止各家闭门造车、各玩各的的状态,心愿能通过AI算法的互通共享,来升高算法开发门槛。

这些外围价值的实现,都是基于云原生,上面将从实时媒体AI的云原生架构、实时处理框架、算法凋谢几个方面具体介绍一下如何通过云原生实现外围价值的。

实时媒体AI云原生架构

首先介绍一下实时媒体AI基于云原生的架构。

从下往上看,首先它是基于华为云的边缘节点,用华为云IEF边缘治理服务对整个的节点软硬件资源做一个纳管,进行调度。其次,框架基于华为云EI平台,提供ModelArts训练等多种能力,反对Tensorflow、PyTorch等支流深度学习框架。框架里还蕴含一个SWR(镜像仓库)的服务,这个服务既能够集成公布华为EI自研算法镜像,也能够集成第三方基于EI的算法镜像。还有一个关键点要介绍,咱们提供一个高性能边缘函数计算能力,这个能力实际上是面向实时媒体AI业务做的一个函数级解决框架结构,它能够十分高性能地将所有的AI算法实时调度到边缘节点上,并对边缘函数进行编排。实时媒体AI平台,用于卸载终端上的媒体解决能力,缩小媒体解决适配不同终端平台的开发量,并保障不同终端平台体验成果统一,面向不同解决方案提供归一化的媒体解决能力。

咱们通过这个架构,提供更多更优的媒体AI玩法,同时,它对立算法的翻新发开平台,能够防止多终端适配。

实时处理函数框架

如后面所述,实时媒体AI的外围是实时,如何最大水平的升高端到端解决时延,让用户对提早“无感”。

实时媒体AI除了将实时处理能力下沉到边缘,就近提供解决、升高链路时延之外,还重点构建了实时处理函数框架,用来升高解决时延。该解决框架次要以下几个方面升高端到端解决时延:1)基于华为云昇腾、鲲鹏等硬件,对AI算法、视频编解码算法做减速解决;2)通过高速总线减速AI算法容器之间视频原始数据传输;3)通过函数资源池预热机制提前加载AI算法,升高启动时延等。 整个解决流程,咱们是心愿能做到100毫秒以内,加上网络的时延,能做到300毫秒以内。这样的话,对用户而言,提早是无感知的。

云原生算法凋谢

如后面所说,华为云不仅仅是构建一个实时媒体AI服务能力,更心愿的是构建面向多种业务场景的实时媒体AI算法生态,心愿更多的搭档参加进来,一起推动业务翻新、用户体验晋升。

基于这个想法,华为云构建了一个算法凋谢的流程,包含所有实时媒体AI算法的规范算法接口和集成流程,也包含算法生态市场的构建,咱们都会陆续的推出。这样的话,不论是基于华为EI平台去构建的AI算法,还是思考到数据的隐衷性,基于本人的平台去构建的AI算法,都能够通过这个流程集成到咱们实时媒体AI外面。

实时媒体AI利用案例—斗鱼

基于华为云云原生RTC实时音视频服务以及实时媒体AI能力,斗鱼实现实时云端特效,将端侧难以实现的特效能力向云侧转移,为用户提供“提早无感”的实时互动体验,促成业务翻新,晋升业务粘性。华为云当先的云原生技术,让斗鱼能够专一云侧翻新,防止适配多种终端,疾速验证翻新成果,大幅晋升研发效力。同时,还能防止SDK频繁更新带来的用户屡次下载,晋升用户应用体验。

基于华为云和斗鱼的算法,单方还构筑了一个富裕设想空间的算法生态。面向未来,单方将继续深入单干,基于AR/VR提供更多翻新玩法,联合华为云算法商城为主播带来更多场景抉择,谋求更优用户体验。

目前咱们正在跟斗鱼一起做美颜、美型、滤镜、贴纸等实时云端特效,这些特效会集成在斗鱼的直播平台外面,后续虚构形象、背景替换等特效也会陆续上线。

低时延云端美颜、背景替换DEMO

第一个DEMO是以后跟斗鱼一起做的一个低时延云端美颜特效,外面包含美白,磨皮等一系列的解决。这个端到端的时延,目前咱们在网络比拟好的状况下,能够做到150毫秒。正如咱们看到的两个比照视频,基本上是同步的,肉眼看不出差异性。

另外的一个DEMO是背景替换的。是一个常识视频外面做的背景替换。前面还会把背景替换成果做得更好,能像电影级的,比如说把背景替换和美颜美型、虚构形象等组合叠加,做出更好更炫的成果。

华为云心愿实时媒体AI是作为减速视频业务翻新的一个要害伎俩,可能提供更多的解决能力,更优的互动体验,更低的翻新老本,当然也心愿更多AI算法合作伙伴们的退出,一起来独特打造一个凋谢生态!

本文分享自华为云社区《实时媒体AI,突破内容创作天花板,减速视频翻新》,原文作者:音视频大管家 。

点击关注,第一工夫理解华为云陈腐技术~