乐趣区

关于RTC:顺畅不卡顿看华为云如何修炼音视频内外功

摘要:云原生时代,视频直播、实时音视频通信等在线音视频服务面临各种简单的网络环境和流量爆发式的增长,对音视频品质监控和老本优化提出新的严厉挑战。

2020 年是不平庸的一年,主观来说它促成了咱们音视频业务的爆发式增长。华为云基于大容量、低时延、全互联的媒体网络,通过全国的 2000 多个节点和几百 T 的宽带,和咱们的客户一起服务了亿级在线用户。在这个过程中,通过大数据晋升视频体验品质和老本优化显得尤为重要,同时华为云也积攒了一些教训。明天来自华为公司,在大数据和音视频业务畛域有十多年研发教训的康永红,将和大家分享云原生时代,华为云在音视频品质监控与优化方面的实际。

本次分享次要分为四局部:

第一局部是云原生时代如何疾速构建音视频数据服务体系;

第二局部是华为云直播和 RTC 音视频服务体验品质优化实际;

第三局部会介绍华为在云原生时代是如何疾速构建音视频服务全流程品质监控平台;

最初总结和瞻望音视频业务体验品质的思考和技术布局。

音视频体验发展趋势及背地技术撑持的挑战

从音视频体验的发展趋势来看分为直播、RTC 和 XR 三代,能够演绎为两个特点:第一点是用户体验越来越实在,传输分辨率从 720P 到 1080P、再到 XR 的 4K、6K、8K、乃至更大;另一点是业务要求互动性越来越强,迟延方面从 30s 到 XR 不超过 100ms,对提早要求更低。

基于以上品质体验的发展趋势,咱们须要有一个后盾技术撑持。咱们在应用大数据解决撑持的过程中也经验了三个阶段:首先是 5 年前用大数据平台解决技术问题,其次是在 3 年前用数据中台解决效率问题,第三个阶段是最近两年咱们综合 1.0、2.0 时代的特点,采纳“中台 + 可信数据服务”的数据服务中台模式解决价值问题。咱们认为数据服务中台是解决业务差异性和市场不确定性的最佳框架。

在直播中咱们常常会碰到卡顿、实时音视频通话提早等状况,这些问题都会重大影响用户体验。解决这些问题的个别办法是构建音视频品质监控平台,采集数据,用大数据的办法解决监控品质问题。在这过程中,咱们又会碰到一些新的问题,比方采集数据提早很大、失落很多、数据不精确,此外还包含大数据算力不够、交付时延比拟长等等问题。这些体验和技术问题带给咱们很多挑战——包含会在什么场景呈现这些问题,无奈精准确定是网络问题、设施问题还是环境问题,以及这些问题影响了哪些客户等等。

那咱们要怎么解决这些问题呢?在端 + 边缘计算 + 云计算的云原生时代,技术上曾经给了咱们一些解决办法。最好的实际是基于“数据湖 + 数据服务”的云原生数据驱动能力,去解决业务差异性和市场不确定性。这套架构分为六层,咱们通过这六层去解决后盾零碎的绝对稳态及前端业务稳态之间的矛盾。

架构落地的具体实际是基于云服务基础设施,首先咱们构建了对立的音视频数据湖,同时构建从采集、生产到生产的数据价值链,通过这两者联合,反对所有同时在线的几大类服务接入,和面向内外部七类客户,以及包含经营、运维等客户数据服务的 QoS、QoE、QoC 等三大类七小类的场景诉求。当然仅仅基于这个架构发展体验品质优化工作是远远不够的,这只是技术上的解决办法。

音视频服务体验优化三步走:监控、诊断、晋升

从在业务角度登程,咱们认为 QoE 体验是一个治理的问题,咱们在业务上须要做一些设计,这块咱们构建了音视频服务的体验体系,大抵分为两个大的阶段和三个小的阶段。两个大阶段是先诊断、再晋升,在诊断中分为监控和诊断两个小阶段。

具体开展来看,首先须要构建 QoE、QoS 的平面实时监控体系以及辅助 AI 的异样检测办法,做到实时发现问题。第二步在发现问题后用秒级诊断能力,疾速诊断体验起因,这个起因能够具体到用户行为级。基于诊断后果,第三步就须要做体验晋升,个别有两种办法:第一种是依附人工教训做优化,另一种办法是智能调度,咱们在面向不同行业、不同场景的状况下,基于智能调度策略在老本可控的状况下做到用户体验最优。

基于上述体验品质优化体系,接下来我将具体开展分享华为云在视频直播和 RTC 实时音视频方面的体验优化实际的案例。

音视频服务体验优化实际 1——直播体验优化

咱们首先看一下华为云视频直播体验优化实际案例,咱们在做到低时延、不卡顿、高清晰的同时,还实现了老本可控。总体分为三个阶段:第一阶段品质监控,第二阶段问题诊断,第三阶段体验晋升。

视频直播的品质监控,咱们首先构建了笼罩流品质、体验、规模、网络、老本、设施六个维度的平面品质监控体系,涵盖了 QoE、QoS、QoC 三十多个指标,其中包含帧率、码率等外围的 QoS 指标,秒开率、卡顿率等 QoE 体验指标和带宽、回源率等老本 QoC 相干的指标。

第二个阶段问题诊断——视频直播的秒级品质诊断,这是基于网络数据 + 端数据构建的直播流全链路监控体系。诊断流程贯通了第一公里主播端监控推流帧率等 QoS 指标,到网络节点间帧率、码率等 QoS 质量指标监控,带宽回源率、老本指标,以及最初一公里观众端卡顿、秒开、黑屏等 QoE 指标。这样就实现端到端实时的秒级监控,如果发现异常状况能够及时反馈给顾客和调度零碎,比方咱们在第一公里发现帧率、码率出现异常,就告诉客户在主播端进行策略调整,如果切实网络发现异常,就做一些节点用户数据调动或其余策略的优化,而当观众端呈现体验异样时,智能调度零碎会做调度策略的调整。以上整个全链路监控零碎笼罩了 12 路直播全场景和全协定监控。

直播流全链路监控零碎——从第一公里、到媒体网络、再到最初一公里,整个都是可视化的,这样能够晋升问题诊断的效率。

第三步体验晋升,视频直播体验晋升大抵分为两种办法。其一是通过运维同学的教训施行,另一种办法是基于智能调度零碎——基于端、边、云数据协同做智能调度体验优化,这种办法利用了对立视频数据湖技术,实现端、边、云的 QoS、QoE、QoC 数据的协同,通过智能剖析引擎生成流、客户、网络链路、节点、观众的实时画像,基于实时画像 + 调度策略由智能调度系统实施智能调度,在老本可控的状况下做到最佳体验。掂量指标次要选取两类指标,一类指标是老本指标,比方通过回源率来掂量老本是否降落;另一类指标为体验指标,通过卡顿率、秒开率等判断用户体验是否有晋升。以上是视频直播在品质监控和体验晋升的一些实际案例。

音视频服务体验优化实际 1——RTC 体验优化

接下来分享实时音视频 RTC 的体验优化的实际案例。RTC 属于第二代音视频业务,它和第一代直播在业务方面有很多差别,比拟关注时延以及行为级的监控,基于这些差异性,咱们也采纳了三个不同优化体系。

第一点是品质监控,RTC 品质监控体系建设了笼罩通话、网络、老本、设施等六个维度的平面品质监控体系,笼罩 QoE、QoS、QoC 三十多个指标。其中外围指标包含等码率、帧率、丢包率、抖动品质 QoS 指标和秒开率、时延、卡顿率、入房和选看成功率等用户体验 QoE 指标,以及带宽等老本 QoC 指标,与直播监控指标相比,特地是端到端的时延指标,这是基于后面提到的差异性着重关注的。

基于监控体系,第二个工作是问题诊断,咱们首先建设了三类体验品质数据服务,第一类是监控指标数据服务,次要笼罩的是服务端、客户端、设施、QoE、QoS、QoC,这些数据放在统计库、时序库中应用。第二类是网络端所有管制面和媒体面的事件数据服务。第三类是终端事件数据服务,包含终端侧用户行为事件,例如退出房间、切换角色、操作麦克风或摄像头等事件,此外还蕴含了终端设备数据,例如 CPU、内存、摄像头等。

基于这三类体验品质数据服务,RTC 构建了三层问题诊断体系。

第一层构建是笼罩全链路、全维度的 QoE/QoS 实时监控体系,能够在分钟级实现体验诊断和疾速复原问题。

第二层监控体系是基于网络行为数据和端侧行为数据的一键式用户个例通话 QoS 考察能力,它能够帮忙咱们疾速解决 RTC 业务单用户的体验问题和投诉。

第三层问题诊断能力是在第一层 QoE/QoS 全局指标监控和第二层 QoS 行为考察能力根底上的体验问题主动诊断高级能力,它通过监控三十多个指标产生二十多个异样事件,并通过学习模型,给出影响的六类体验场景。这样零碎就能够疾速自动化地判断出体验产生异样的起因,并且疾速传递给客户。

如何构建音视频服务全流程品质监控平台?

上述介绍的是华为云 RTC 业务体验优化的实际案例,做体验品质优化工作是须要平台实现的,咱们上面来分享华为是如何构建音视频服务全流程品质监控平台的。首先从数据采集、传输、计算到生产四个环节的亿级规模音视频品质监控大数据平台,包含反对端、边、云全数据采集和传输的数据网络,反对实时计算、离线计算和机器学习的多模数据处理系统,以及反对运维、经营、客户的数据生产服务体系。

在构建平台时,会遇到很多性能、品质、效率以及实时性的问题,如何构建一个大容量、低成本、高效率和可信数据品质的平台?咱们采纳了批流一体和存算拆散的架构。批流一体解决的是开发效率的问题,咱们同一个指标可能在批流一体中计算一次就能够对所有服务应用,不须要反复开发,同时咱们有一站式数据开发平台能够解决开发效率的晋升。老本问题上咱们采纳的是存算拆散——存储和计算是拆散的,存储采纳的是对象存储,价格绝对低廉,计算引擎采纳的是后面介绍的批流一体的形式,这样能够做到老本最佳。品质方面是采纳了“ODS-DWD-DWS-ADS”四层数据治理平台,保障所有数据可跟踪、可治理,确保任何指标数据都是实时、残缺、精确的。

在有了大容量、低成本的平台后,咱们还面临断网、设施故障等问题。咱们在平台可用性上基于云服务施行,采纳跨 Region 主备容灾和多 AZ 模式,整体 SLA 可达 99.99%,来自端、边缘、云等全副六类数据不失落,监控、调度等六类服务不降级。这样咱们在整个环境下,任何环节出现异常,在品质和服务晋升上都能够失常工作。

如何继续保障音视频体验品质三大利器?

回顾本次分享,音视频体验倒退有三个特点:第一,用户对体验的要求是真实感越来越强,直播、RTC 等用户要求更高;第二,在用户体验上要求越来越互动;第三,面对各种网络、终端业务环境越来越简单。

为了保障音视频体验品质,咱们有 3 个利器:第一,针对不同业务场景,构建“先监控再诊断后晋升”的体验质量体系;第二,基于“数据湖 + 数据服务”解决用户差异性和市场不确定性的问题;第三,在施行过程中要均衡老本和体验的关系。

对将来音视频业务体验咱们有三点布局方向:一是继续基于端、边、云数据协同来驱动 QoE、QoS、QoC 优化;二是构建音视频内容品质的智能评估体系;三是建设第三代 XR 音视频体验品质标准,如沉迷感等。

本文分享自华为云社区《云原生时代,解密华为云音视频品质监控与优化实际》,原文作者:音视频大管家。

点击关注,第一工夫理解华为云陈腐技术~

退出移动版