关于音频:音频的价值AI-Codec-的意义与算法能力的边界丨一期一会-•-音频工程师专场

36次阅读

共计 2548 个字符,预计需要花费 7 分钟才能阅读完成。

前言

音频技术倒退到明天,经验了从模仿音频到数字音频到历程。国内音频工程师协会创立于 1948 年,中国数字音频技术起步绝对较晚,长期被国外组织和公司垄断。随着中国的一直倒退、科技日益提高,通过近三十年的致力,咱们在语音辨认重建、音效声场重现、数字音频通信等方面,积攒了很多本人的音频技术专家和学者,曾经逐渐放大和东方的技术差距。

为了更好的促成行业交换,壮大音频畛域的中国力量,遍及公众对音频技术的了解和认知,咱们推出了面向音频领域专家的「一期一会」流动,心愿能为更多的音频技术从业者打造一个充沛交换的平台,咱们欣慰地看到大家在流动中碰撞出许多有意义、有价值的思维火花,愿「一期一会」能承载和点燃更多音频技术人的幻想。

—— 声网技术合伙人、音频编解码专家

本文基于「一期一会 • 音频工程师专场」中探讨内容整顿,观点仅供参考。

01 对于如何讲述音频的价值

互联网音频技术通过最近一、二十年的倒退,曾经从「听个响」倒退到了「听得爽」的阶段。在许多业务场景下的实现曾经达到了 90 分以上的程度,持续进步的难度开始陡增,因而持续投入的产出比(ROI)开始受到质疑。

而在音视频直播行业内卷的大前提下,工程师攀登技术顶峰的诉求未然变得曲高和寡。在 ToB 和 ToC 的畛域,如何将音频技术的价值充沛地、清晰地表达出来变得尤为重要。这里既波及到所谓的工匠精力缺失,也存在压服企业管理者的挑战。

此外,对于音频品质的评估也不足对立的规范、企业倒退过程中对短期指标的谋求等等制约,都使得音频的价值很容易被疏忽。

但整体而言,音频尤其是 WebRTC 畛域仍有许多场景化的落地工作能够持续开辟,更多细分畛域如音乐等还有许多问题有待解决。思考到技术落地的代差问题,在工程化实现的环节必然存在诸多的挑战,这也正是能够展现工程师价值的中央。

02 音频工程师的钻研与翻新

从国际局势的变动来看,中美脱钩势必在技术方面呈现更多卡脖子的环节。从芯片行业就可见一斑,如芯片工艺制作(台积电)、配备资料(光刻机、蚀刻机、离子注入机)、设计 IP 核和 EDA 软件(指令集 ARM、X86 等)。

再回到音频畛域,也存在同样卡脖子的环节。那么在这些环节上,国内势必会产生对标的产品、技术和规范(如 AVS),并且会依据国内的场景、利用现状具备差异化。与此同时也会带来更多的机会,音频工程师应该多关注翻新技术、为行将到来的风口做好筹备。不要满足于在 GitHub 上找个须要的我的项目就间接「拿来主义」,要多做调研、寻求更佳的实现,造就本人翻新的能源和志愿。

03 算法能力的边界

以后音频圈存在竞争加剧、算法能力存在边界等问题。除了寻找新的发力点,工程师自身也须要晋升自我涵养,来冲破能力边界或解决具体业务场景下的特定问题。

从采集到播放,每个环节的算法都还有可优化的空间。一些优化,可能会借助 AI。不过 AI 的优化,会须要从硬件底层来做,比方借助 DSP 来晋升性能,让更高复杂度的算法能够落地到挪动端(比方高通平台),从而针对局部场景实现更好的音频体验。

04 对于 AI Codec 的意义

即使单纯从低码率这一个极其的方向看,把 Codec 做到极致仍然会有意想不到的利用场景会找上门来,例如哪怕是现在的 5G 时代,弱网场景仍然十分广泛。从人与人沟通体验的极致谋求来看,以后业界的倒退也只是解决了可懂度方面的问题,间隔沉迷式的体验需要还有很长的路要走。另外,AI Codec 在通用场景(音乐与语音)的后劲尚有许多能够开掘的后劲。

05 端到端的音频优化道阻且长

从工程的角度来看,音频体验的改善还是要端到端地对每个环节逐个优化,能力整体上晋升用户的体验,单纯在某一个环节的优化反而意义不大。然而端到端的优化是一个系统工程,往往会消耗大量的工夫和精力,并且须要在总体上进行兼顾和调度。

06 基于场景而非具体问题

跟端到端优化之话题相似,工程师在解决问题的时候肯定要基于产品的利用场景,而不要基于某个或某些具体的问题。因为前者会让人从零碎和全局的维度去思考,带来的收益远比解决具体问题大的多。

07 元宇宙与音频技术

从技术倒退的角度来看,音频畛域很长时间没有突破性的翻新了。元宇宙这个风口兴许会带来新的(技术落地)场景,例如沉迷式音频的体验会成为标配;但现有的软硬件环境间隔实现元宇宙的构想还有肯定的间隔;细分到具体的技术点如空间音频,目前技术较为成熟、会很快落地。整个行业都很期待元宇宙能带来新的冲破,对工程师而言肯定多站在业务的角度进行技术的积攒。

08 技术落地的代差问题

回顾音频产业倒退的历史,不难发现任何一项成熟技术的大规模利用(尤其是民用)都存在较长时间的代差。对于处在最前沿的音频工程师来说,如何克服技术自嗨和业务落地之间的 GAP 是一个较大的挑战。

但大家容易漠视的中央在于,一个行业的技术改革并不是欲速不达的,通常体现为继续质变的积攒 ── 正因为大家身在其(音频行业)中再加上技术落地的代差,造成的错觉和感知不会那么强烈才会“不识庐山真面目”。五年前谁会想到打电话的模式会是现在手机视频通话的样子?而新生代对沉迷式体验的需要正在一步步变成事实 ── 这在现在的游戏行业曾经初现端倪。

09 Hi-Fi 市场的潜在机会

目前 Hi-Fi 耳机市场上呈两极分化的态势,中端价位、尤其是面向年轻人的产品存在显著的市场产品。从寰球制造业的格局来看,国内品牌存在很大的机会。

以后的挑战在于 巨头凭借产业链劣势会更容易会抢占这个市场,所以还是须要具备一些“不容易复制”的壁垒。而且更重要的是,也要学会面向用户把音频体验的故事讲清楚。就像苹果一步步从内容源、音频算法、设施布局发力,直至 Airpods Pro 公布,「空间音频」的故事幅员才出现在用户背后,现在 Airpod 曾经成为该畛域上最胜利的产品。

对于「一期一会」

「一期一会」是声网发动和组织的音频技术工程师线下团聚交流活动,由来自音频行业上、上游的工程师围绕“近半年最有成就感的事、对热点技术和行业倒退的思考”外围议题进行探讨。启动半年来已在北京、上海、杭州等地举办过多期,吸引了来自音频软硬件厂商、音视频互联网服务商、高校和科研单位、规范组织等百余位业界专家参加。

对于音视频技术或行业,你有哪些观点或者疑难?欢送通过私信或留言的形式与咱们分割。兴许下一期内容就能够为你解答,或邀请你参加咱们的线下流动。

正文完
 0