关于云计算:多维评测指标解读2022MSU世界编码器大赛结果

43次阅读

共计 3061 个字符,预计需要花费 8 分钟才能阅读完成。

是极致性能,更是最佳商用。

19 项第一之上,是 63% 的极致带宽升高

近日,2022 MSU 世界视频编码器大赛问题正式揭晓。报告显示,阿里媒体解决服务 MPS(Alibaba Media Processing Service)s264 及 s265 编码器共计斩获 19 项评测第一,相较大赛指定基准编码器(AWS Elemental MediaConvert),可再节俭高达63% 的码率,极大幅升高带宽和存储老本。

MSU 世界视频编码器大赛是视频编码压缩畛域最具权威和影响力的寰球顶级赛事,迄今为止已举办 17 届。仅在往年的云转码赛道中,就有国内外 8 家参赛单位的 19 款编码器加入较量,包含微软、亚马逊、腾讯等出名科技企业。

此次,阿里云视频云自研 s264 编码器在 H264主观赛道及主观赛道全面当先,取得了 19 大细分赛道中的 15 项第一,并在雷同主观品质下至多可节俭 16% 的带宽、存储老本,在转码效率上较友商当先 13 倍;同时,自研 s265 编码器在相当的带宽及存储老本下,具备较友商2~6 倍的转码效率及更精准的码率管制

480p Comparison

720p Comparison

1080p Comparison

1080p Subjective Comparison(主观赛道)

为了全面地评测参赛编码器的程度,MSU 较量采纳了 PSNR、SSIM、VMAF 等多个经典 主观指标 ,和基于人眼打分的 主观指标

PSNR,基于对应像素点计算原始视频和失真视频之间的误差来评估失真视频的品质,是目前视频品质评估中最传统最根本的评估准则,然而因为 PSNR 并未间接思考人眼视觉个性,因而其评估后果与人的主观感触并不完全一致;

SSIM,从亮度、对比度和构造信息三个方面来预计失真图像的视觉品质,旨在比拟原始视频和失真视频的构造类似度,钻研感知构造的伤害来评估视频品质,能够更好地反映人眼主观个性;

VMAF,是将人类视觉建模与机器学习相结合的一种视频品质评估指标,将不同评估维度的算法进行“交融”,旨在失去一个能精确反映主观意志的画质评估规范,但人眼视觉零碎是一个简单零碎,该指标还需有大量无效的、符合实际评测环境的数据集。

人眼主观品质,代表了视频品质的黄金规范(golden standard),因为人是视频最终的消费者,因而主观品质评估是站在观测者的角度,实在反映人的视觉感触和审美程度,防止各种主观品质模型都无奈全面模仿人的视觉零碎的问题。

察看 MSU 赛事会发现,其中的“SSIM”也被 MSU 主办方选为次要评估指标。

“For objective quality measurements we used YUV-SSIM metric (see Appendix F.1) as a main objective indicator, and other metrics (PSNR, VMAF) as an additional quality metrics. Our team is constantly researching the area of objective video quality metrics to find good solutions for large comparisons.”

在编码器的理论开发过程中,为了升高测试难度和测试老本,往往以主观评估为主,但在最终版本公布时,依然将主观品质作为最重要的评估根据。实际表明,对编码器采纳这样的评估办法,不仅能够保障编码器的开发效率,同时也能够保障编码图像品质合乎人眼的主观个性。

云转码,何为最佳商用?

无论是主观还是主观指标,在公众的无限焦点中,往往适度关注单维的画面质量,而疏忽了更为要害的利用指标——转码速度和码率管制。

本次赛事中,除编码视频的画面质量外,MSU 大赛主办方还评测了各云转码厂商的 转码速度、码率管制(码率准确度) 等重要指标,可全方位地评估各厂商的 编码器性能及商用价值。而真实性能和商用价值,也正是编码器的外围所在。

首先,是转码速度。

咱们晓得,码率越高,视频压缩水平越低,相同,码率越低,示意视频压缩水平越高,该指标在保障画质的同时,最间接影响的是带宽及存储老本

同时,转码速度越快,则意味着转码工作的时效性高 ,在理论商用场景中,速度带来的效率晋升显而易见, 转码效率更高也意味着功耗更低

如下图所示,在雷同品质下,纵坐标示意各厂商编码器绝对于基准编码器输入文件的平均码率(bitrate)大小;横坐标示意,在雷同品质下,较基准编码器所需的编码工夫比例。

以 H264 1080P,YUV(6:1:1)SSIM metric 子赛道为图例

正如横 (Faster) 纵(Better)箭头所指,越凑近图片左上角则示意:在雷同品质下,该编码器的码率越低,转码速度越快。 可见,除了前文提到的主客观画质卓越,阿里 MPS s264 在编码器性能及商用价值维度更加处于当先之势。

同样在 HEVC/AV1 赛道中,依据下图所示,纵向比照,阿里 MPS s265 编码器在品质雷同的状况下,较大赛基准编码器可节俭高达 63% 的码率。 同时,横向比照,在雷同品质及相当的带宽、存储老本状况下,具备较友商2~6 倍的转码效率。

以 HEVC 1080P,YUV(6:1:1)SSIM metric 子赛道为图例

值得一提的是,如下图,MSU 官网首页结果显示:阿里 MPS 转码速度最快,转码所需时长稳定最小 ,这背地意味着 阿里云视频云可能提供更加稳固牢靠、实时满足商用要求的相干转码服务,而这也是云厂商技术实力和综合能力的体现。

横坐标示意转码时长,图例长度示意转码时长的稳定

再者,是码率管制。

码率管制精准率也是理论商用中须要参考的重要指标,为什么这么说?

在理论商用中,客户对画面质量与老本是非常敏感的。若码控不佳,编码器理论输入码率可能与指标码率差别较大,对客户的理论体验产生较大影响。

例如,当客户的需要是升高带宽、存储老本时,编码器理论输入码率可能比指标码率高出很多,这会导致客户带宽、存储老本的减少;而当客户的需要是画质的高度保真时,编码器输入的视频码率可能低于指标码率很多,这会导致整体画质受损重大、无奈满足终端客户需要。综合来看,高度不稳固的码控最终将导致商业价值的受损。

可见,码率管制的基础性和必要性。

针对码率管制,下图则示意 HEVC/AV1 赛道的理论输入码率与预设指标码率的比例,有限靠近 1 示意该编码器码率管制的精准度越高

以下图举例,假如客户须要将视频压缩至 500M,如果码率管制不佳,理论输入码率和预设指标码率之间差距少则 2 倍,多则 7 倍,则输入视频可能在 1000M 到 3500M 之间随机产生。

因而,一款最佳编码器,其外围指标并非比拼繁多性能的指标,而是 在极致品质、极致码率、极致效率和老本之间,寻求最极致的多维度均衡,最终为赛道和客户带来最无效的利用冲破,而这更是一款商用编码器所具备的最佳品格。

“软硬一体”的自我进化

从 MSU 大赛视角,转移到商业落地,可能看到更多的技术冲破和利用翻新。

阿里 MPS 次要基于视频云自研的两大编码器 s264 和 s265,笼罩直播,点播,RTC 场景,从内核、前解决到码控各个局部,基于不同利用场景开发了 100 多个算法。

此外,阿里云视频云与平头哥数据中心解决方案团队联结,针对倚天 ECS 进行 s264,s265 编码器的深度优化,打造了 ARM 敌对的视频编码器。

在 ARM 视频编码优化上,重构了视频编码数据构造,并行框架,从新调优了疾速算法策略,从 软件 汇编 硬件 层面跨层深度优化,打造极致老本。

将来,阿里云视频云会基于倚天 ECS 的超强算力,聚焦视频编解码、视频解决继续开掘算力空间,通过“软硬一体”的联结优化,继续塑造极致性能。

正文完
 0