关于行业:火山引擎推出影院级字幕同传方案助力村上隆跨国直播

57次阅读

共计 1691 个字符,预计需要花费 5 分钟才能阅读完成。

12 月 12 日,日本艺术家村上隆在今日头条、西瓜视频、抖音同步开启首场中国直播,吸引近 80 万人次在线观看。直播过程中,村上隆向中国观众分享了他近期的图书作品以及新的作品灵感,驰名摄影师蜷川实花和出名主持人蔡康永也与村上隆探讨了艺术理念等问题。


图:村上隆首场中国直播,火山同传提供实时智能同传字幕

本场直播中,火山引擎旗下的火山同传产品独家全程提供了实时智能同传字幕,通过深厚的技术实力和稳固的产品服务,给中国观众带来了晦涩的跨国直播体验。

火山同传对外首秀 打造“影院级字幕”

在传统会议、直播场景中,机器翻译解决方案提供的字幕通常是“打字级字幕”,观看这种字幕,观众须要投入很大的精力在浏览和了解字幕上,观众体验十分差。起因有两个:一是“打字级字幕”全程会不停跳动,观众的眼帘无奈聚焦,容易造成视觉疲劳。另一个,每句字幕的停留时间过短,观众往往来不及看完就会跳到下一句。


图:火山同传“影院级字幕”,晦涩稳固


​图:传统“打字级字幕”,频繁跳动

为了晋升用户体验,此次村上隆的跨国直播中,火山同传创新性地推出了“影院级字幕”计划,与视频流整合后流畅地输入残缺的译文语句,在屏幕上逐句显示。观众能够分明看到精准的字幕后果,免受字幕跳动带来的视觉烦扰。

在本次村上隆的跨国直播中,火山同传的“影院级字幕”计划就引起了观众们的好奇和质疑。在弹幕里,就有个别观众质疑真的是否在直播。


图:村上隆直播中的字幕吸引了关注

火山同传产品经理示意:“这种质疑在咱们看来,是对咱们的必定。为了实现‘影院级字幕’成果,并在直播中保障‘音画字同步’,火山同传筹备了一套延时字幕计划。”

该计划中,音频被推送到主控端实现机器同传后,人工利用直播的推拉流延时工夫,在机器同传的后果上进行内容校对,以保障投屏字幕的强可读性。之后,火山同传的画面延时性能,可能保障校对后的字幕在延时完结后准时送出,与延时后的画面整合并同步推流到观众端,最终呈现出增加了高质量字幕的直播画面。

保障一场业余直播同传字幕品质的要害是定向的技术优化。字节跳动卓越科学家、人工智能实验室总监李磊介绍,在村上隆的直播中,火山翻译团队除了采纳前沿的神经网络机器翻译技术进行模型训练外,还针对直播场景引入了畛域适应技术,将村上隆以往的访谈和演讲数据用于优化算法,并对书面语规范化、专业术语定制都进行了非凡优化解决,确保最终出现的字幕可能简洁、精准。

百项专利、50 余篇学术论文 打造专业翻译产品矩阵

火山同传“影院级字幕”的背地,是火山翻译团队超过 40 位顶尖科学家、工程师打磨出的机器翻译模型。

火山翻译由字节跳动计算机钻研科学家、工程师、产品经理、产品经营和语言专家组成的业余团队研发,领有包含火山同传、火山翻译 API、火山翻译 Studio、浏览器翻译助手等在内的一系列矩阵产品。

目前,火山翻译已反对超过 50 个语种的全语向互译,利用于办公、娱乐、新闻等各类场景中,每天为来自寰球的过亿用户提供优质的翻译体验。



图:关注火山翻译微信公众号,或拜访官网(https://translate.volcengine.cn)理解更多产品详情

火山翻译团队领有百余项技术发明专利,在人工智能顶级国内学术会议已发表 50 余篇学术论文。其自研的高性能序列推理引擎 LightSeq,推理速度业界当先,比原生零碎进步 10 倍,翻译速度可达 20,000 词 / 秒。

在近期刚完结的机器学习顶级赛事——2020 国内机器翻译大赛(WMT2020)中,通过寰球语言专家充沛评估,火山翻译在「中文 - 英语」语向翻译我的项目上力压群雄,以显著劣势取得世界冠军。

在人工智能畛域,“如何让 AI 更好地赋能行业”始终是个值得摸索的方向。火山翻译的火山同传在这个方向上对外迈出了松软的一步,将机器同传的高效快捷和人工翻译的精准进行联合。此次村上隆跨国直播中,火山同传就为观众提供了“影院级字幕”的直播体验,实现“1+1>2”的成果。

李磊示意:“火山翻译将致力于打造前沿钻研、产品研发和用户反馈的闭环,在迭代中疾速提高。心愿火山翻译能帮忙更多用户进行国内跨语言交换,为行业乃至整个社会倒退奉献一份力量。”

正文完
 0