乐趣区

关于前端:眼界大开-声临其境网易首届音视频技术大会圆满落幕

2021“眼界大开 声临其境”网易首届音视频技术大会落下帷幕 。来自网易旗下网易智企、网易游戏、网易云音乐、网易杭州研究院等泛滥音视频畛域的技术大咖们齐聚一堂,联合本身多年钻研与教训积淀,与观众 独特探讨音视频前沿技术翻新,分享音视频利用实际成绩,为行业倒退带来了诸多新的思考和见解。

家喻户晓,视觉是万物感知的次要信息起源,听觉让缄默的信息更进一步而变得“绘声绘色”。在挪动互联网时代下,“声色俱佳”的在线学习、工作、娱乐形式广受欢迎,互动直播、视频会议、近程招聘等新场景纷纷涌现。而其背地是音视频技术的大力撑持,耳濡目染中融入了各行各业的在线场景。

基于此背景,“眼界大开 声临其境”网易首届音视频技术大会应运而生。严密围绕着“色”与“声”,本次大会别离设置“眼界大开:视频技术创新视界”和“声临其境:音频技术沉迷体验”两大专题分会,全程为期两天,为所有到场嘉宾和线上观众贡献了一场酣畅淋漓的科技盛宴。

网易音视频技术大会

展技术,促交换

首先,本届大会的总出品人、网易智企技术 VP 陈功博士讲述了本届大会举办的契机和目标。陈功说道,近几年音视频技术倒退迅猛,商业化落地减速,而网易在此畛域继续进行着技术创新和冲破,并在 今年初成立了网易 TM599 音视频技术分委会,并期待通过分委会集中展现网易团体在音视频各个细分畛域的技术能力积攒,同时促成行业内的交换与单干。


网易智企技术 VP 陈功

眼界大开

视频技术创新视界

在“眼界大开:视频技术创新视界”专题分会上,专题出品人、网易音视频实验室高级技术专家韩庆瑞介绍了专题的次要内容,联合网易云音乐、网易易盾、网易云信、网易互娱在视频技术的实战经验,本场分会将围绕 视频解决、视频深度鉴伪、内容平安、视频加强及计算机视觉技术、AI 舞蹈合成 等话题开展深度分享。


网易音视频实验室高级技术专家 韩庆瑞

网易云音乐资深视频算法工程师眭世晨从当下炽热的短视频畛域切入,以技术视角 深度分析了云音乐中多种视频作品创作工具的性能和设计思路,并认为技术最终只是辅助创作者表白价值的工具,而非间接取代创作者的想法。


网易云音乐资深视频算法工程师 眭世晨

网易易盾资深图像算法工程师胡宜峰介绍了 AI 在各个场景利用的“双刃剑”效应,并以最为突出的人脸伪造隐患为例, 从算法和利用的维度分享了网易易盾在视频深度伪造检测方面的解决策略和显著成绩。


网易易盾资深图像算法工程师 胡宜峰

网易云信资深视频算法工程师周琛晖梳理了影响视频清晰度、色调、品质等一系列问题的起因,并针对各项问题逐个分享了基于 AI 视频解决算法的解决办法,网易云信画质加强在实时音视频交互、低延时直播、点播等场景大有可为。

网易云信资深视频算法工程师 周琛晖

网易互娱资深 AI 钻研工程师谭志鹏着重介绍了在游戏和影视行业中常见的舞蹈动画,并阐释了舞蹈动画生成背地不易的过程,以及 如何通过 AI 音乐舞蹈合成算法技术,疾速且高效的制作生成高质量的舞蹈动画。


网易互娱资深 AI 钻研工程师 谭志鹏

声临其境

音频技术沉迷体验

“声临其境:音频技术沉迷体验”专题分会同样充斥了技术干货。专题出品人、网易云音乐音视频实验室负责人刘华平介绍,新冠肺炎疫情极大推动了线上利用场景倒退,实时音视频通话是泛滥利用中十分“刚需”的技术点,音质也是音视频通话零碎中最为外围的参数之一。


网易云音乐音视频实验室负责人 刘华平

网易云信音频算法专家郝一亚首先回顾了 RTC 实时通信的背景和次要利用场景,并介绍了 网易云信 AI 降噪技术的架构和成果,以及回声打消算法。在音频标准化评估体系建设方面,网易云信也付出了很多致力,如:设立音频实验室、建设降噪算法评估体系等,并期待以此一直推动国内 RTC 音频畛域的倒退。最初分享了网易云信诸如 3D 音效、AEC 等其余音频能力和音频实验室的学术研究成绩。


网易云信音频算法专家 郝一亚

网易云音乐音视频算法负责人赵翔宇示意,沉迷式音频对用户取得实在的、身临其境的体验十分重要。围绕此主题,赵翔宇列举了影响声场沉迷感的次要因素,以及应答的技术计划。最初展现了技术计划的音频成果,让所有现场和线上的观众也一起“沉迷”了一把。


网易云音乐音视频算法负责人 赵翔宇

来自网易杭州研究院的语音算法专家刘东、杨震、李响聚焦于 AI 技术在语音相干畛域的研发与利用多年,并别离从各自深耕的 音频了解零碎、语音辨认中的声学模型、语音辨认线上推理零碎 三大维度开展讲述了研发过程中面对的技术挑战、解决思路和理论案例。



网易杭州研究院语音算法专家 刘东、杨震、李响

网易游戏雷火音频设计专家付明铭则以 AI 音乐的开发和利用为主题进行了分享。付明铭提出,AI 音乐是一个算法和艺术的穿插畛域,实质是通过各种算法对音乐数据进行剖析与学习,造成审美绝对确定的格调模型,并基于用户输出在选定的格调模型中进行内容生成。


网易游戏雷火音频设计专家 付明铭

大会已闭幕

技术分享从不止步

2021“眼界大开 声临其境”网易首届音视频技术大会已圆满闭幕。大会上,来自音视频各个细分领域专家们的精彩演讲,为行业实际与利用提供了切实可行的技术计划,也为行业倒退提供了新的思考和见解,指引着将来技术方向和发展趋势。

大会曾经闭幕,技术共享从不止步。讲师们的远见卓识吸引了超过 5.4 万人次观看,并广受观众认可。为不便观众重温回顾,促成技术交换共享,演讲视频将陆续公布于实践者沙龙、云商会、MCtalk、Bilibili 等平台,相干内容文章也将陆续公布于“网易智企技术 +”微信公众号,敬请各位关注。

扫一扫关注公众号,立马获取最新资讯~


退出移动版