近日,联结图像专家组 JPEG 颁布了 JPEG AI 规范平台提案后果,火山引擎多媒体实验室凭借软件平台 BEE 的优异体现,取得主观品质性能评比最佳问题。
JPEG 是国际标准化组织、国际电工委员会和国际电信联盟的工作小组。信息“爆炸”时代,图像压缩对于互联网数据的传输和存储至关重要。得益于深度学习在图像压缩技术上的飞速停顿,JPEG AI 小组公布了 JPEG AI 规范平台提案的征集,心愿构建全新的智能图像编码零碎,在晋升图片品质的同时,也能进步压缩性能。
来自世界各地的高校、科研院所、企业等数十家单位,提交了各自的软件平台计划。在雷同文件大小的前提下,图像压缩最重要的评估指标是人类的主观视觉感触。此次主观品质性能评比中,火山引擎软件平台 BEE 优于其余参赛软件平台,名列该项评比的榜首。
据悉,主动驾驶、媒体散发等场景对图像压缩技术有较高的要求,须要在无限带宽的条件下传输更多高质量图片。智能图像编码是人工智能技术在图像压缩上的跨畛域利用,在工业利用中具备微小后劲,是图像压缩的重要倒退方向。
火山引擎多媒体实验室负责人示意,BEE 软件平台提出了多个翻新算法,解决了智能图像编码软硬件实现中的一系列难题,独创的“解耦式熵编码”技术更是化解了长期困扰端到端压缩的数据依赖,使得编解码速度有了根本性晋升。
据介绍,业界在智能图像编码过程中,熵编码与像素重建过程是高度耦合的,“这就如同一个力工和一个瓦工配合造房,力工每次给瓦工一块砖,等瓦工抹好水泥砌上并给出收条后,他才会去搬下一块。这在流程上造成了‘耦合’与‘依赖’,会影响造房效率。
”火山引擎“解耦式熵编码”技术突破了这种制约,“力工不必再等瓦工抹水泥,只须要不停地搬砖放到指定地位就能够,甚至能够叫来更多力工一起搬。而瓦工也不必关注力工,只有指定地位有砖,他就能够不停地砌墙,从而大幅提高生产效率”。
图 1:JPEG 官网主观测试后果图,TEAM16、24 为火山引擎的计划
图 2:JPEG 主观测试 DMOS 表,TEAM16、24 为火山引擎的计划
测试结果表明,BEE 平台的解码速度要比其余参赛软件平台高 1 - 3 个数量级,其速度曾经超过最新的规范 H.266/VVC。在图形处理器 GPU 加持下,BEE 平台解码工夫仅为 H.266/VVC 官网参考软件的一半。
火山引擎多媒体实验室是字节跳动旗下的钻研团队,致力于摸索多媒体畛域的前沿技术,参加国内、国内的标准化工作,其泛滥翻新算法曾经广泛应用在抖音、西瓜视频等产品的多媒体业务,并向火山引擎的企业级客户提供技术服务。