关于音视频:小谈音视频质量检测

33次阅读

共计 1456 个字符,预计需要花费 4 分钟才能阅读完成。

自己从一位测试的角度登程,基于目前我的项目中摄像头的直播和语音对讲业务,正寻求音视频的品质测试及一些监控剖析伎俩。工作中发现达到肯定的并发水平之后,就会呈现延时、卡顿、丢帧、马赛克等问题。所以最近在网上看看专家的直播和专栏,学习一下行业内的好的测试方法。

这不,前几天有幸参加了声网的音频算法工程师赵晓涵的对于《 实时语音品质监控零碎的过来、当初和将来 》的在线直播和探讨。本次直播旨在介绍一下声网实时语音品质监控零碎的停顿,并和大家交换了一下将来的演变方向。

整顿了一下,本次直播次要的内容次要涵盖了以下几个模块:

1、过来:语音品质评估算法

2、当初:线下测试的线上化

3、将来:感知、反馈和监控一体化

一、过来:语音品质评估算法

其中,过来的语音品质评估算法次要介绍了有参考主观评估办法、无参考主观评估办法和主观评估办法。

一千个观众会有一千个哈姆雷特,主观评估办法暂且不管。有参考主观评估办法中利用最宽泛的有 P.862 PESQ、PESQ-WB 这两种。12 年左右推出了最新的有参考评估办法 P.863 POLQA,它是基于 PSQM 的降级革新。它们都次要依赖无损的参考信号。而无参考主观评估办法无需参考信号。其中的 ANIQUE+ 据作者称,其准确度超过有参考的 PESQ,这一点也很有意思。

主观评估办法的痛点:

1、有参考办法:只能用在上线前

2、无参考办法 - 传统信号域:利用场景窄,鲁棒性差

3、无参考办法 - 传统参数域:仅在无限弱网条件下能够放弃精度

4、无参考办法 - 深度学习:利用场景和语料无限,复杂度高(信号域)

在语音品质评估算法这一方面,咱们真的是小白。基于目前业务的,次要笼罩还是功能测试、接口测试和流媒体的局部性能测试。利用现有算法对语音品质进行评估,临时可能还不会做。

2、当初:线下测试的线上化

直播中赵晓涵老师在这一块次要回顾了下在设计这个零碎前的指标,和目前上下行链路的次要问题和解决办法。

现有的评估零碎的设计指标:

1、精度高:评估后果牢靠

2、笼罩业务场景广:游戏、娱乐、教育等业务场景

3、算法复杂度不能太高:不会对性能造成很大的升高

4、和语音内容弱相干能力:不论输出是语音、音乐还是噪声,剖析后果不能受影响。

上行次要有这几个流程:编码、传输、解码、播放

上行侧的品质评估办法也是次要依据下面四个模块开展的:

1、编解码器性能:不同的编解码器对不同的语料处理结果不一样

2、网络传输:丢包、抖动和提早等

3、弱网反抗算法品质:丢帧弥补

4、设施的外放能力:设施硬件差会对音质有所伤害

这一部分内容深有感触,咱们目前用到的摄像头来自海康、大华、雄迈、TPLink 等好几个厂商,同个厂商又有多种型号。不同设施都有硬件差别,就连根本的国标接入都会有些许异样,更别说在音视频上的体现了。目前咱们平台所用的视频编码正从 H264 到 H265 转变,音视频品质测试显得分外重要。

而网络传输也是咱们目前的性能测试常常遇到的瓶颈,尤其是是视频文件上传 s3 存储会很大水平受限于上行的带宽。另外还有应用 udp 传输,不可避免得造成数据的丢包等问题。

不同的终端设备,对音频外放的音质也不尽相同。这一点咱们在兼容性测试时曾经有所发现。

三、将来:感知、反馈和监控一体化

对将来的零碎的指标:

1、外部状态更细:上行链路细节待优化。

2、体验笼罩更广:目前有些噪声还未能笼罩,待优化。

3、反馈速度更快:指标在 1 分钟内能收到反馈。

4、笼罩通话更全:指标是每一秒都能监控到。

一个笼罩广,响应快,又精准的平台会是所有平台的平台的指标,心愿能早日看到平台给音视频品质检测行业带来更大的促成。

正文完
 0