关于音视频:超低延迟直播架构解析

本文由百度智能云-视频云直播技术架构师——朱晓恩在百度开发者沙龙线上分享的演讲内容整顿而成。内容从低延时直播背景与时机登程，剖析低提早直播技术，重点分享百度在低提早直播技术的实际工作。

文/ 朱晓恩
整顿/ 百度开发者核心
视频回放：https://developer.baidu.com/l…

本次分享的主题是：超低提早直播架构解析，内容次要分为以下三个方面：

低提早直播背景与时机
低提早直播技术剖析
LSS低提早直播技术实际

01 低提早直播背景与时机

随着各行各业直播的遍及，加上疫情的强势推广。在线教育、直播带货、企业培训、线上招聘等实时互动的场景迅速升温。直播已成为企业数字化转型和内容营销的必备场景。

在直播中，用户实时互动体验始终是商家重点关怀的问题。例如直播带货过程中，主播曾经上完优惠券，10几秒过来了，用户却还在期待优惠券。超低提早直播能够大大晋升边看边买的体验，主播能够联合互动区更好实现控场和互动，并且让秒杀、抽奖、拍卖等对时效要求高的营销玩法有了更强的底层撑持，大大优化直播转换率。

又比方流动赛事直播场景中，电视/文字直播用户已在呐喊，而视频直播画面还未进球。超低提早能够极大的加深观众对于现场实时互动的沉迷感，参加比分和现场的互动，晋升用户对于线下流动的参与感。

而随着5G时代的到来，网络条件正疾速晋升：边缘带宽实现Mb向Gb增长，5G网络时延降落到1~10毫秒；依靠于AR、VR技术的直播更是大大晋升了用户的沉迷式体验。
这些对低提早直播来技术，都是重大的时机。

02 超低提早直播架构解析

RTMP/FLV直播提早起因剖析

接下来，咱们以一个简略的直播架构为例，剖析传统的 RTMP/FLV 直播产生提早的起因。

架构介绍：
主播通过 RTMP 推流到流媒体服务器，再从直播流媒体服务器通过 RTMP/HLS/FLV 等技术向观众散发包。
而一个视频直播传输过程如下：
视频输出摄像头采集数据——CDN传输——视频解码
「设施端解决提早」、「网络层提早」和「服务器外部解决提早」。

缓存策略
缓存策略次要指CND的GOP缓存，但这种缓存策略会减少提早。码率过高或 GOP 太短会造成 TCP 累积提早。
TCP累积提早
编解码过程中，解码端在显示之前的视频帧缓存和编码端的缓存都会造成提早。
编解码缓存
解码端在显示之前的视频帧缓存和编码端的缓存都会造成提早。
编码
编码环节中的 B 帧解码也依赖于前后视频帧的达到。

因为以上起因，传统的基于 RTMP/FLV 的视频直播个别会产生 3-5 秒左右的提早。提早高的关键在于CDN的传输和播放解码没有很好地配合和互动。所以要实现低提早，次要解决这个关键问题。

低提早直播计划简略比拟——基于UDP

基于 TCP 的视频直播存在较长的提早。为此，人们开发出了 SRT、QUIC、WebRTC 等一系列基于 UDP 协定的低提早直播计划。
下表能够简略概述一下基于UDP的各项低提早直播计划的特点：

介于WebRTC生态凋敝，百度抉择了WebRTC做为低提早，在下一章节会基于百度智能云音视频直播服务LSS，具体介绍低提早的直播计划实现。

03 LSS低提早直播技术实际

LSS低提早直播方案设计指标与过程

设计指标:

兼容已有直播业务，反对录制、截图、转码、RTMP/FLV等多协定散发。
反对百万并发，实现直播的CDN散发。
将提早管制在1s以内。

实现过程：
如上图所示，在典型的 LSS 直播推拉流的流程中

主播首先在主播端通过 LSS 推流 SDK 实现 RTMP 推流，在该过程中将实现实时美颜、实时滤镜、视觉特效、硬件加速等性能；
视频流会被推到寰球智能接流网络中，进而接入 LSS 媒体核心，通过服务器端 SDK 实现实时转码、主动鉴黄、多码率输入、实时水印、实时截图、内容加密、录制点播、统计分析等性能，买通与点播、存储、RTC 等其它云服务产品的分割。
接着，通过寰球智能散发网络，基于 RTMP/FLV/HLS/WebRTC 等计划将视频流散发到客户端，通过 LSS 播放器 SDK 实现 LSS 播放，在该过程中，将实现首屏秒开、追帧播放、自适应码率、解密播放等性能。

直播场景革新

WebRTC 自身是面向多人会议的实时通信计划，为了使其更好地实用于直播场景，咱们须要对其进行一系列的革新，从而反对大规模的低提早直播散发。

就组件协定而言，采纳 AAC、H.264 音视频引擎、UDP 传输层协定、RTP 媒体协定、RTCP 数据协定。通过 STUN/ICE 实现建联，并且通过 HTTP 申请实现 SDP 协商。
就QoS 计划而言，通过 NACK 的形式实现丢包重传。在播放侧进行基于 Jitter Buffer 的缓冲，在发送侧基于 PACING 机制调整发送的频率和码率，通过 GCC 实现拥塞管制，进而预计并反馈带宽。
就具体的革新点而言，依然应用上行 RTMP 协定，反对非加密传输，音频转码反对 Opus，视频反对 B 帧，实现了 FLV timestamp 透传和 Metadata 透传。

直播CDN反对与品质

WebRTC 低提早计划须要思考对直播 CDN 的反对与品质。

首先，采纳与 RTMP/FLV 等协定雷同的多级直播 CDN 散发拓扑，实现回源与推流。
这套计划通过了大规模并发的考验，更加稳固成熟。在CDN 边缘节点上进行封装协定的转换，例如：WebRTC/FLV 协定能够复用节点回源数据，如果某条直播流上曾经存在 WebRTC/FLV 的播放回源数据，就能够实现更快的响应。

此外，百度 WebRTC 低提早计划依靠于百度 CDN 的海量资源节点以及优质骨干传输网络，建设了覆盖全国的实时节点品质拨测系统与智能流量调度零碎，实现了更欠缺的直播流品质监控零碎，能够实时监控直播流回源过程中的卡顿等指标。

申请过程

WebRTC 低提早计划的申请过程次要分为「媒体协商」、「网络协商」、「媒体传输&信令传输」三个阶段，咱们进行的次要革新包含：

在媒体协商阶段中，在客户端通过 HTTP API 拜访节点，从而携带播放的 URL、SDP Offer。在服务端，取得直播流对应的媒体形容，如果直播流曾经存在于节点上，能够间接取得媒体形容，否则将会通过回源拉流来获取媒体形容。此外，会生成并记录会话 token，通过 HTTP 协定相应返回，通过 ice-ufrag 字段对应会话的 token。

在网络协商阶段中，通过 STUN 在客户端发动 Binding Request，并在 USERNAME 字段中携带会话 token。这样一来，咱们在服务器端就能够通过 USERNAME 映射到 ice-ufrag 字段，从而对应到拉流的过程，返回 Binding Response。

在媒体传输 & 信令传输阶段中，实现 RTP 和 RTCP 的复用传输。

总结：
综上所述，LSS实现了基于 WebRTC 的低提早端到端解决方案，该计划依靠于成熟稳固的百度 CDN 直播散发架构，反对百万并发和多协定并发，可能兼容直播媒体核心的产品矩阵，接入的老本较低，买通了与 BRTC、BOS 等百度智能云产品的分割，反对更多的应用场景。

欢送大家在百度智能云官网体验：https://cloud.baidu.com/produ…

以上是老师的全副分享内容，有问题欢送在评论区提出。

点击进入取得更多技术信息~~

关于音视频:超低延迟直播架构解析

01 低提早直播背景与时机

02 超低提早直播架构解析

03 LSS低提早直播技术实际

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于音视频:超低延迟直播架构解析

01 低提早直播背景与时机

02 超低提早直播架构解析

03 LSS低提早直播技术实际

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复