关于图像识别:自动化视频质量保障

“随着挪动设施的遍及和短视频行业的衰亡，大量视频被存储到云端并经由互联网进行大规模地流传。以 COS 上的视频内容生产流程为例，从被生产进去到被消费者观看，视频大多在数据万象经验了摄取、压缩、解决、传输和复原等诸多环节，不可避免地对视频产生各种画面失真与降质。例如，视频编码技术尽管可能帮忙咱们节约存储与传输所耗费的带宽，但却会对视频带来不可逆的画质损失；传输过程中的网络问题，同样会导致视频画面的缺失与播放卡顿。对于视频生产服务而言，可能量化并监控这些品质降落显得尤为重要，有助于维持并晋升整个平台的服务质量。”

在 COS 大量的视频内容生产过程中视频品质评估承当了什么角色？

置信当初习惯了高清视频的用户再看座机画质视频那相对是一种酷刑，对于泛滥流媒体提供商来说，蹩脚的视频品质就是劝退用户的关键问题之一。呈现包浆视频的起因可能因为：一、视频历史长远；二、视频压缩解决；三、视频编辑操作等等，COS 上的视频起源泛滥，大小品质参差不齐，波及到的视频解决环节穿成像、编辑、解决、编 / 转 / 解码、渲染、显示，这时候不呈现渣画面那必定是 hard 模式了。

为了使用户的视频不因为品质问题而错失关注与商机，数据万象在整个生产过程中须要帮忙用户进行源视频的品质剖析，判断是否要进行加强操作以及通过视频视频评估确定视频丑化的成果是否合格，在散发到不同平台时依据用户侧的反馈联合视频品质评分调整视频参数，视频品质评估的重要性显而易见。

典型的 COS 视频品质自动化保障流程：
Step1、用户将视频上传到 COS 后即可开始应用视频品质评分，通过品质评分将素材进行品质分级。Step2、为每个品质分级的素材进行其品质级别适配的解决形式。
Step3、为解决后的半成品素材进行解决以适配不同的散发渠道，应用品质评分为各素材确定出最适宜的转码参数。
Step4、查看行将散发到不同渠道的成品素材的品质状况。同时咱们在保障过程中以晋升用户体验为指标，一直反向推动视频解决的成果优化。
数据万象视频品质评分接口请参考：https://cloud.tencent.com/doc…

整个品质保障过程均为自动化流程，无需人工染指，以晋升用户体验为指标，在保障性能的状况下，一直反向推动视频解决的成果优化，确保用户成品视频的品质。为了使 COS 视频品质评分可能为用户真正带来收益，咱们在数据集构建，模型设计方面都有诸多实在业务的因素考量，上面就为大家带来具体解读。

主观评估 & 主观评估
大部分状况下视频服务的最终接收者都是人，因而“主观评估”这一画质评估办法失去了宽泛使用，也是迄今为止最牢靠的评估形式。主观评估指通过人类观测小组对画面的品质或侵害进行的判断，须要依附大量的人力，制订具体的对立的评估规范，导致了其测试效率低且老本昂扬。为了解决上述问题，“主观评估”应运而生。主观评估指利用数学模型对视频的画质进行自动化的评估与量化，同时保障评估后果有限靠近于主观评估后果。

全参考 & 无参考
在视频品质评估过程中，依据原始视频信号是否可取得，能够将其划分为全参考评估和无参考评估，并别离映射出不同的视频品质定义。“全参考评估”中认为原始视频是能够获取且领有“完满”画质，并将原始 & 待测视频的差别映射为品质分数。与之绝对，“无参考评估”指原始视频不可获取，评价者 / 器按照其对完满画质的统计先验、背景常识对被测视频进行剖析失去品质评分。因而，无参考评估可能被使用到原视频无奈获取、视频画质晋升等利用场景中。
咱们做视频品质评估的意义在于提供高效低成本的主观评估办法，成果有限趋近于主观评估。对立视频品质评估的规范，防止主观评估中的个体差异问题，在视频解决的各环节起到踊跃作用。主观评估办法通过数十年的倒退曾经越来越贴近人眼主观的感觉，但仍存在许多问题。

设计指标咱们的品质评估模型须要贴合市场需求，有限靠近于主观评测的规范，且规范易于泛化，兼容多样化的视频场景，同时又具备低成本高性能的个性。咱们的数据集建设、评估模型设计都为了这样的指标而服务。联合目前业界痛点，在品质评估算法设计之初咱们拟定了以下设计指标：
易部署。不便嵌入到生产链路中的任意环节
低开销。模型计算量低，可运行在低算力机器上
贴合主观感触。预测分数与主观感触相符合，分数稳定小
针对手机观看场景。贴近当下热门的应用场景，失去更精确地观感预测
防歹意攻打。能肯定水平阻止歹意进步分数的行为

自研数据集的构建

海量视频筛选保障样本多样性和所有基于统计的机器学习工作一样，品质评估数据集的采样散布平均水平、与业务理论数据的贴合水平会间接影响最终产出模型的性能与泛化能力。这里，咱们依据空间复杂度、工夫复杂度、色调、含糊水平、亮度、对比度等人眼敏感的画面特色对视频进行样本平衡。确保筛选后的标注视频各特色维度散布平均、画面多样性高；咱们的视频筛选过程基于足够大的原始样本池，数据量达百万级别，可能撑持高平衡度的筛选后果。

筛选前后各特色维度散布比照制订针对手机观看场景的标注规范为了贴合覆盖率越来越广的手机观看场景，补救业界在该场景下大规模视频品质评估数据集的空白，咱们制作了专门针对手机场景的自研数据集。该数据集的观看、打分全程在手机上进行，保障标注人员的打分齐全反馈理论手机应用过程中的观看体验。

咱们参考 ITU-R BT.500、ITU-T P.913 等传统画质评测行业标准，对手机标注规范进行设计，并取得了外部多个业务部门认可。评测形式采纳无参考、五分制打分；应用手机作为视频播放、评测、打分工具；对手机屏幕分辨率、长宽比、亮度、观看间隔严格控制。上面列出了规范中的局部细则：

执行严格的视频标注 & 验收流程

在标注过程中，咱们延聘了外部上百人的业余打分团队进行品质标注，并在标注全流程的各个环节预埋了打分可靠性保障机制，确保最终取得的标注分数可靠性高、波动性小。最终，咱们取得了~50W 次高质量人工标注。

标注流程示意图

标注前：标注员需通过预打分测试，测试合格能力开始正式打分工作；
标注中：正式打分工作中随机预埋测试视频，对标注员打分品质进行实时监控；
标注后：利用先进的打分可信度评估办法对人工打分进行可靠性剖析、加权融自研评估模型

采纳无参考评估模式视频从生产进去到被生产两头经验的拍摄、解决、转码、散发、渲染等泛滥环节，整个 pipeline 十分复杂，波及到的硬件设施品种泛滥，咱们心愿品质评估工具能像探针一样插入到其中的任意环节，监控各个环节的画质变动，因而咱们采纳无参考品质评估模式，实用于线上简单的视频解决流水线，对于无奈获取参考视频的节点也能顺利部署。

* 无参考评估模型 *

模型设计
咱们的品质评估能力基于深度学习进行建模，自研高性能特征提取模块与时空域注意力模块，晋升模型整体表征能力；利用模型轻量化技术对模型进行裁剪，在维持模型预测精度的同时升高计算复杂度；在此基础上引入了模型反抗攻打的设计，能肯定水平阻止歹意进步分数的行为。

性能指标
品质评估畛域通常采纳预测值序列与标注值序列之间的 PLCC、SROCC 等相关性系数作为模型性能的掂量指标。PLCC、SROCC，值域范畴均为[-1, 1]，值越靠近 1 则相关性越高。计算公式如下所示：

模型性能
得益于高质量的数据标注与优异的模型设计，在测试集上模型预测与标注分数达到了很高的 PLCC 和 SROCC。左图中，横轴代表标注分数，纵轴代表模型预测得分，能够看到两者的散布呈现出较好的相关性。

利用一：视频全链路品质监控
无参考工具能够对视频链路上的各个环节进行品质监控，实用于编码、解决等各种场景，找出品质的瓶颈点。

利用二：视频要害参数决策
线上视频的分辨率 / 码率阶梯对体验影响十分大，但不足迷信的决策机制，依赖业务数据来反馈调节，应用品质评估能力能帮忙工程师不便地进行决策。甚至更进一步，依据每个视频的具体得分状况来抉择不同的分辨率和码率，保障每个视频的体验。

利用三：视频技术计划选型
视频解决技术的蓬勃发展为视频产品带来了丰盛的技术选项用于改良视频体验，因而如何抉择适合的技术，如何评估不同的技术计划对体验的影响成为了关键问题，品质评估能力能为技术计划的选型提供参考。

腾讯某自有业务应用品质评估能力来对业务链路进行监控，找到品质瓶颈点，并针对问题设计了视频品质改良计划。施行后码率有所降落，品质数据改善显著，业务品质失去晋升。

画质改良前后比照如果您想理解视频品质评分的更多信息，请点击[https://cloud.tencent.com/doc…]，查阅官网文档。

关于图像识别:自动化视频质量保障

导语

什么是视频品质评估

腾讯自研的品质评估是如何实现的

品质评估能力的利用

经典案例：腾讯某自有产品视频品质晋升

Just My Socks（注册教程内含优惠码）

关于图像识别:自动化视频质量保障

导语

什么是视频品质评估

腾讯自研的品质评估是如何实现的

品质评估能力的利用

经典案例：腾讯某自有产品视频品质晋升

Just My Socks（注册教程 内含优惠码）

Just My Socks（注册教程内含优惠码）