关于音视频:面向体验助推超视频时代新增长

32次阅读

共计 5238 个字符,预计需要花费 14 分钟才能阅读完成。

2 月 25 日,火山引擎视频云科技原力峰会顺利召开。
火山引擎视频云是如何倒退起来的?火山引擎要做什么样的视频云?将来视频云又会是什么样的?火山引擎视频云技术负责人浩铭在以《面向体验,助推超视频时代新增长》为主题的演讲中,分享了对视频体验、交互、增长的察看与思考,并介绍了火山引擎视频云的从前、当初,以及将来的技术布局与构想。他示意:置信视频利用会继续朝着三个方向演进,更高清、更交互、更沉迷。


火山引擎视频云技术负责人浩铭

以下为浩铭的演讲实录:

大家好,我是来自火山引擎视频的浩铭,很快乐明天能跟大家一起做分享,独特面向体验,助推超视频时代新增长。

火山引擎视频云进化史


首先给大家介绍一下火山引擎视频云的进化史,这里列了几个要害的工夫点:
起初在 2014 年,这时候字节跳动还在做图文利用。大家比拟相熟的今日头条,就是这个时候 DAU 冲破一千万。过后,公司曾经预计到将来是视频的时代,就开始在头条摸索视频的状态,视频架构部门也是在这个工夫点诞生的。
下一个工夫点到了 2016 年,字节跳动推出短视频 APP 抖音,与直播 APP 火山直播。随着字节系的产品一直裁减,视频架构在公司的地位也变成了视频中台。咱们作为中台一直地在公司外面孵化更多端到端的解决方案,像图片点播也在这个工夫点成为解决方案,然而那时候咱们的定位是面向性能、解决业务的问题。
2018 年,字节跳动自身业务飞速发展的一年,对咱们来说也是挑战很大的一年。首先咱们要保障业务的稳定增长,保障业务的扩容是平顺的,同时业务对咱们有了更多的要求,不止性能层面,还要对业务的性能与后果提供更大的帮忙,于是咱们对业务的体验优化做了更多的投入,继续优化端到端的视频体验。这个工夫点,咱们本人开始逐步意识到,“体验”的重要性。
到了 2020 年,咱们开始认真思考 ToB 的事件。之所以在这个工夫点思考 ToB,基于三点思考:

  • 第一点,咱们作为中台反对的字节产品越来越多,如果把中台的服务模式变成 ToB 的服务模式,置信对业务的反对效率与组织效力上有很大的晋升;
  • 第二点,通过几年的业务打磨,曾经具备行业当先性,咱们把曾经积淀好的能力输入进来,应该能够失去更好的商业价值;
  • 第三,咱们心愿引入内部的视角,聆听来自行业的声音、用户的声音、客户的声音,让咱们扫视已有的技术,放弃咱们的先进性。
    基于几点思考,咱们逐步把团队从中台走向 ToB,把之前的积淀解决方案革新为对外的解决方案,把本人的服务做成平台化,更加规模化地接内部客户。这时咱们接了第一个内部客户,懂球帝。
    在 2020 年之后,这样的演进还在继续产生,比如说火山引擎正式 ToB,让视频云在 ToB 上顺利承接有了更大的投入,在产品的齐备度和服务的规范性上有了大幅的晋升。以及字节跳动收买了 Pico 之后,咱们开始在沉迷式视频上进行了更多的摸索。

    如何搭建品质体验体系

    从整个视频云的成长史来看,字节跳动的业务“养成”了视频云,而且视频云十分有幸在这个过程当中见证与帮忙字节跳动的成长。咱们心愿明天把积淀下来的能力与教训凋谢给行业的合作伙伴。
    方才在演讲过程当中,我提到了一点,咱们从能力建设开始面向体验的建设。通过几个直观的问题让大家感受一下到底这两个之间有什么区别。

  • 业务数据不好,是不是因为播放体验有问题?
  • 咱们播放体验的劣势是什么?
  • 新上线一些新的性能,对业务的奉献到底如何?
  • 咱们总说极致体验,体验是什么,以及怎么才算极致?
    大家可能感觉到画风不一样了,之前咱们谈性能的时候,更多是在谈性能有没有,好不好,有多好。这些会落到能够比照的,相似卡顿这类的指标。但回到体验,更多是业务带着最终后果向咱们提问,到底咱们的能力对业务有什么帮忙,咱们怎么答复这样的问题。
    首先我感觉每个问题都很难答复。在这儿我想分享一下教训,包含做事形式与思路。

大家看左边这张图,分成外边的一个圆环与外面的矩形。外边的圆形更多是咱们在日常研发外面的做事形式,置信大家都十分相熟。这外面有一个与大家做的不一样的,是线上试验的环节,外面的矩阵更多是内功,外围就是始终在致力建设数据的剖析和归因能力。咱们要做一个事件可能预估它的收益,并且可能及时回收收益。在内外联合、相辅相成的思路与做事形式下,咱们再看方才的几个灵魂拷问是不是能够答复了。
对于方才的几个问题咱们能够形象一下,变成一些更实质的问题。

第一个是如何掂量体验?

大家应该会有一些共识,体验指标能够分成 QoS(Quality of Service)指标和 QoE(Quality of Experience)指标。QoS 往往是从服务或者性能的视角统计服务质量,包含起播工夫、百秒卡顿、画质指标、延时等。这些是跟研发具体做的动作间接相干的,它们十分重要,而且是研发做的每个动作的直观体现。
咱们在实际过程中,逐步从最后的关注 QoS 指标,过渡到当初以 QoE 指标为主。因为 QoE 是从用户视角反映问题,通常是与用户播放时长和频次等相干的聚合指标,以反映用户的应用志愿,也与增长关联更加间接。它比 QoS 好的一点,QoS 是单方面,有可能把咱们的优化领导偏,而不是全局最优,QoE 是给了一个最终后果。咱们带着这个最终后果有能力与业务的增长后果做关联。

下一个问题,体验与增长之间是怎么关联的?

之前有很屡次的技术分享,大家对字节跳动的 A / B 试验有理解,它提供了一个让咱们真正成为业务外面的技术参与方,能间接看到咱们的动作与业务增长关联的平台。有了这个平台之后,咱们能够很不便地每个月做几十次线上试验,一直摸索体验指标与业务指标的关联,一点点打消元无知。

最初,如何优化体验,体验须要优化到什么水平?

如果咱们打算做一个性能优化,什么时候该做,做到什么时候该停。第一因为咱们有外部劣势,能够快捷地开大量的试验,所以能疾速、不停地迭代尝试出一个经验值,这个经验值能够在具体场景外面复制、积淀,能够推广出更多的业务方应用的。
另外一个形式就是应用业务已有的数据,做一些已有数据分析,比如说首帧与弃播之间的关系。咱们找到拐点,因为这个拐点可能就是这个业务的优化空间,如果过了这个拐点,有可能优先级能够放一放。咱们通过这种形式建设决策,去答复体验到底须要优化到什么水平。
方才介绍了研发的体系,上面我举几个例子,把这些例子失去的积淀论断分享给大家。

首先是在短视频场景下,方才我也提到了对于首帧的剖析,咱们通过试验与数据分析失去这样的一个论断,就是 210ms 这个数字。在短视频 feed 场景下,咱们认为 210ms 相当于流媒体首帧的满分规范。首帧大于这个值,用户的留存可能就会受到影响。

对于画质来讲,也是一个很直观的指标,大家心愿有很清晰的视频体验,咱们做了十分多的动作,这里举一个例子,特定环境下网络受限的用户,不得不抉择低分辨率的视频去播放,这样终端的成果必定是不好的。咱们有一些伎俩,通过超分辨率的形式,在终端把不好的播放体验从新超分成一个好的视频成果。单单这样的对于受限场景下的优化,对于大盘整个视频播放时长有 0.23% 的增长。


在直播上,延时也是很敏感的指标,然而的确与业务增长的关系是比拟难量化,咱们在“低提早直播”性能上线之后,也尝试做了反转试验,把曾经 3s 端到端延时的用户,从新晋升到 7s,咱们看了一下后果是什么样。这个工作做了之后,咱们看到用户的看播时长降落 1.3%,社交浸透与电商订单都有显著的降落。也是因为有了这样时延的佐证,咱们对于低延时直播的资源投入在继续的增长。


方才提到了一些研发投入深耕的场景,其实对于体验的优化可能不须要那么浅近,有一些简略的 Case 被大家疏忽掉,一样能够达到很好的后果。举一个看上去很简略的音量平衡例子,大家看直播或者点播的时候有刷视频的动作,刷到下一个视频如果声音忽高忽低,可能会有很差的播放体验,甚至因为声音变大吓一跳。咱们预期音量平衡的计划会拿到正向的后果,实际上做完试验之后后果远超预期,不仅在人均看播时长增长了 3%,而且电商直播的 GMV 超预期晋升 4%。其余像这些小的点有很多很多,只有这个思路存在,咱们就有更多可挖的空间。
除了技术,还有很多的玩法,能让留存、拉新失去很多晋升。介绍一下“一起看抖音”场景性能,这个场景是在抖音短视频观看时,能够让很多用户同时在看,大家看的进度是一样的,而且看的同时能够做音视频的聊天,以减少趣味性与陪伴感。它在抖音上线曾经靠近一年,月均 DAU 持续保持 30% 以上的增长,渗透率曾经晋升 10 倍。

面向用户打造极致体验,面向企业继续技术创新

方才是对体验优化方法论后果的展现,我前面分享一下火山引擎视频云将来的技术布局与构想。正如咱们和 IDC 一起公布的视频云白皮书中所提到的,咱们置信视频利用会继续朝着三个方向演进,更高清、更交互、更沉迷。上面对这三个方面,我别离谈一下咱们在技术上的储备与布局。

更高清

首先更高清。大家都经验了从彩色电视,到数字电视,到后边 1080P,以及这次北京冬奥会大家都享受到的 8K 超高清转播,以及 8K VR 直播,甚至 8K 更高分辨率的视频。这样对视频编码与传输,始终都是很大的压力,如果压缩跟不上的话,尽管能够用一些伎俩升高画质实现 8K 的传输,然而这样成果是“高不清”。


火山引擎多媒体实验室团队,始终在继续地摸索极致的视频压缩和图像增强技术,在受限带宽下继续晋升用户的视觉体验。
近期火山引擎落地业界首个 H.266 端云一体视频解决方案,相比目前支流的 265 编码方案,能节俭 30%-50% 的码率,在一些利用场景下最高可节俭 70% 以上码率,能够大大降低超高清视频利用的门槛,减速推动体验降级的过程。
除了方才编码效率的优化,咱们对更高清的谋求,不只是压缩效率更高了就是高清,当用户都感觉清晰了那才是高清。到底怎么掂量、反映用户观看视频的感触呢?
除了始终致力于建设画质的端到端整体优化计划之外,咱们还在尝试建设一套和用户感官齐全匹配的评估体系,咱们推出的是 VQScore 画质评估算法体系。咱们能够把它用在很多不具备参考条件的场景下,比方竞品评测、视频品质监控、基于视频品质的举荐,基于人类主观感触的视频端到端优化、低质视频筛查等。而且 VQScore 画质评估体系曾经在多媒体畛域的世界级会议拿到第一名的好问题。

更交互

下一个发展趋势是更交互。在业务倒退中,新的交互方式往往会带来新的商业冲破,技术的优化,能够让更多的互动玩法与商业场景成为可能。这里咱们看两个极致些的例子。
第一个是语音沙龙。语音沙龙是今年年初十分火爆的场景。之前因为技术架构的限度,产品不得不把可能上麦的主播数量管制到 20-50 个,一旦更多就会很凌乱。火山引擎 RTC 通过订阅逻辑的革新,让产品逻辑更加灵便,单房间最高反对超过千人上麦,成为国内首家可能提供单房间超过千人上麦的音视频服务。
第二个例子是 VR 场景下的千人 Livehouse,这对端上渲染能力有很大的要求。因为咱们有了低时延服务端渲染的能力,云渲染的超低延时架构将简单的渲染计算放到云端做,把计算后产生的音视频画面,用 RTC 传输到本机。无论多简单的计算,本机只须要播放音视频的性能耗费,从而解放终端的性能限度。

更沉迷

最初一点,是更沉迷。前边提到更高清与更交互,是达到更沉迷的先决条件。另外还有两个因素,自由度和虚实交融。咱们始终以来大家观看视频的体验,次要是滑动、切换下一个视频或者是拖拽,其实这时候咱们没有太多的自由度,而更多的视频将来要求咱们提供更多的自由度。比方能够通过 VR 看到更广大的视线,甚至能够通过多机位达到自由度的成果,独特组合成六自由度的 XR 体验。

我置信很快会有更多杀手级的 XR 利用呈现,给视频的出现与体验模式带来代际的更新。咱们一直打磨沉迷式视频体验能力,也一直地积淀在云解决方案当中,心愿能和更多业务合作伙伴一起推动行业的改革。
比方,方才提到了超过千人连麦,将来通过 VR 设施和技术,咱们能够实现千人在一个独特的虚构场景中,实现更多样化、更沉迷的社交活动,比方通过本人的 Avatar 替身聊天、一起刷抖音、看直播、一起玩游戏等,这种利用场景会波及到点播、直播、RTC、边缘渲染、云游戏等多个视频云解决方案的交融。

面向体验,助推超视频时代新增长

更高清、更交互、更沉迷是咱们一直的谋求,心愿帮忙合作伙伴引爆一个又一个新的业务增长点。明天,火山引擎视频云公布产品矩阵——为用户体验而生的视频云服务,咱们心愿打造全新的产品服务体系。


产品矩阵整体划分为三层,别离是外围中台、外围产品及解决方案。

  • 底层是咱们的外围中台,是咱们技术能力的积淀,从生产、解决、传输、生产,笼罩视频内容生产全链路。让更多的互动玩法和商业场景成为可能。
  • 中间层是咱们的外围产品,蕴含点播、直播、图片解决、实时音视频等。
  • 下层是行业全栈解决方案,蕴含泛互联网游戏、在线教育、金融广电等,咱们置信全栈解决方案是驱动更多商业场景落地的要害变量。
    火山引擎视频云面向体验,助推超视频时代新增长,心愿能够和更多的业务搭档一起摸索下一代互联网新场景,一起发明更多的价值。明天我的分享就到这儿,谢谢大家!
正文完
 0