双 11 猫晚是家喻户晓的综艺晚会,在今年的双 11,阿里集团为 2500 万用户提供了一场在线直播视觉盛宴。网友评价这是一场既稳定流畅又高清的直播,当然在这背后离不开阿里云的技术支持。
本次天猫晚会中,视频云首次采用 4k 和 50 帧的技术,把整个画质提升到接近肉眼极限,同时为用户提供了如丝般顺滑的直播体验。
那么这么一场大型活动的直播究竟是如何炼成的呢?阿里云视频云技术专家裘良科带我们从稳定、画质、流畅、监控四个方面开始解读。
如何做到 100% 稳定?
裘良科认为:“最安全的做法就是做好 500% 的准备,以不便应万变。”
下图是双 11 直播的技术架构,分为几大部分:直播源站、视频直播中心和 CDN 分发系统和客户端。简单的看这张图,所有的链路都是双备份的。直播源站部分,采用了多线收流、主备转码器、多线专线等策略,直播中心都是多机房接入,再采用多流合并,当任何一个机房出现问题的时候,输出的直播流是不会受任何影响的。在这之后,直播中心会对直播流进行转码、录制、智能处理、切片、时移回放等处理,中间所有模块都是专有资源池供大型活动使用,保证不会受其他活动影响。任何一个模块发生异常,都可以秒级进行切换。产生到的内容在分发之前,会先进行存储,中心主备。到了分发环节,会实时检查源站的质量,并进行切换。
在这样的架构之下,任何单点、单机房、单线路、单模块的故障,都不会导致直播服务不可用,几乎做到绝对安全。
当然,除了自身稳定之外,安全也十分重要。在安全方面,视频云在推流、播放和拉流等环节,采用多重鉴权、IP 黑白名单、播放格式 / 地区 /IP 等限制、HTTPS、防劫持等能力,实现全链路安全保障。
如何让用户享受到极致的画质?
一、实时 4K 直播
视频清晰度作为衡量用户体验的重要指标,也是视频云技术团队十分关注的方向。本次猫晚的视频清晰度再度升级,通过阿里云直播服务提供实时 4K 直播,将现场 4K 超高清、高帧率的视频实时处理,进行画质提升。在 4K 视频的处理上,直播服务大规模使用 GPU 进行视频处理及转码,大大提升了实时视频处理能力,保证了直播视频最高 4K 的 HEVC 实时转码。据悉,4K 高清直播已在阿里云的众多游戏直播客户中广泛使用。
二、50 帧极清
阿里云和优酷合力研发的 50 帧极清技术,可通过人工智能算法预测运动方向和轨迹,将原始的每秒 25 帧画面普通电视信号变换为每秒 50 帧画面的高帧率视频内容,给用户提供更加流畅的沉浸式观看体验。
50 帧极清的效果,就像去电影院看大片,动作效果非常丰富的情况下,也不存在顿挫感。今年夏天的世界杯和本次双 11 猫晚都采用 50 帧技术,视觉上看是非常流畅的。
三、码率(比特率)最佳配比
除了 4K 技术,基于内容进行编码优化也是视频云的优势。裘良科表示:“阿里的窄带高清技术精髓就在于使每一个比特分配到最需要它的地方。”
这里我们先来看几个概念:
分辨率是图像精密度的概念,代表着质量的极限,是不是越大越好呢?是也不是。分辨率大,点就多,需要的码率就高,需要的带宽就会变大,传输成本和对网络的要求都会变大。
码率,比就是比特率,它代表单位时间传送的数据位数,视频文件大小就是由码率决定的,而且是成正比。
帧率,代表着视觉流畅度,在我国通常帧率在 25 帧左右。然而帧率达到 50-60 的时候,我们几乎肉眼察觉不到间隔和差异。
那我们如何在帧间和帧内进行合理码率分配,以达到最优的平衡呢?
1. 合理分配帧间码率
每一帧都需要码率来显示图像,那么我们如何判断哪一帧需要较多的帧率?哪一帧需要较少呢?其实这就需要基于对内容的分析,提前进行预判,你认为这一帧是复杂的画面,比如好莱坞动作大片,就多分配帧率,如果这一阵比较简单,比如新闻联播,就少分配。以此来实现合理的帧间码率分配。
2. 合理分配帧内码率
在整个图像中,并不是全部都需要非常清楚的。比如说你在看晚会的时候,你看的是中间的人物嘉宾,所以把人物和脸识别出来,就是你眼睛聚焦的地方,多分配一些码率。同时,衣服的褶皱纹理也多分配一些码率,背景作为脱焦区域,就少分配一些码率了。通过帧间、帧内的码率分配,让整个视频的质量更高。在同等码率之下,获得更高的质量。同样质量之下,可以节省更多带宽。
那在播放层面,如何保证流畅不卡顿呢?
裘良科认为,在确保直播流畅度上,全球覆盖的 CDN 节点和精准调度系统缺一不可。CDN 节点是采用分布式架构,拥有遍布全球的 1500 个节点和充足的带宽储备,单节点带宽 40Gbps+,全网带宽输出能力 120 Tbps。同时采用四层智能调度架构(如下图),来确保整个分发的流畅。
如何实现精准调度,确保大型活动突发峰值的流畅
但是面对晚会等大型活动,突发峰值非常高,需要更精准的调度策略,来实现调度。打比方有一个装了很多冰块和水的杯子,如果我们要把杯子里面的狭小空间全部用上,我们先要把冰块放进去,再倒液态水。DNS 的协议限制类似冰块。其他别的调度形式,比如 IP 调度,可以做好请求级别的调度,也就是支持任意比例的负载均衡,就像液态水一样。所以,在智能调度的场景里,把“固体”和“液体”结合起来考虑,才能做到所有的节点、水位的精准控制,实现更精准的调度。
同时,在码率瞬间激增的情况下,常规的流量预测算法失算了,进而会干扰流控程序, 这个问题阿里云使用了基于 AI 流量预测进行预调度,在 10 分钟内的预测的精准度到 98%,一小时的精准度 95% 以上。
监控系统保驾护航
在确保了稳定、画质和流畅之后,一场大型活动的直播离不开监控系统。我们肯定需要对当前的直播状态做监控,以确保及时调整策略。
监控从以下四个方面进行:
1、流监控:针对每一路流进行秒级实时监控,及时获得直播流的帧率、码率、时间戳等状态 2、播放质量监控:实时获知服务端慢速比,用户端卡顿率 3、可用性监控:实时返回视频 5XX 等播错误数据,及时定位视频失败原因 4、业务量监控:实时获取当前在线用户数
作为这场猫晚的唯一网络直播平台,优酷平台上直播观看人数近 2500 万,是去年的两倍。这也是阿里云视频云第四年支持双 11 猫晚网络直播,从作战室监控的数据上来看,猫晚直播期间各项系统数据指标运转平稳,一场稳定、高清、流畅的大型活动直播就就此实现。
经过世界杯、双 11 猫晚等多次锤炼,视频云直播服务已经具备一整套大型赛事 / 活动 / 综艺直播的服务经验,并实现对阿里云各行业客户的赋能,为视频行业创造更多价值。
本文作者:樰篱 阅读原文
本文为云栖社区原创内容,未经允许不得转载。