此前,向世界传递中国声音的“女神翻译官”们实力出圈,引发了公众对于同声传译的关注。为推动机器同传技术倒退,2021 年 6 月 10-11 日,第二届同声传译研讨会(The 2nd Workshop on Automatic Simultaneous Translation),将随自然语言解决畛域重要学术会议 North American Chapter of the Association for Computational Linguistics(NAACL)一起在线上开启。本届同传研讨会由百度联结谷歌、华为、格勒诺布尔 - 阿尔卑斯大学独特举办。
▲ 图:第二届机器同传研讨会
近年来,机器同传获得较大停顿,但仍面临着诸如语音辨认谬误流传、翻译模型鲁棒性差、数据稀缺、评估体系不健全等挑战。继 2020 年在 ACL 胜利举办第一届机器同传研讨会后,此次研讨会持续邀请来自百度、帝国理工学院、华盛顿大学、香港中文大学等机构的机器翻译和同声传译畛域的专家学者,独特探讨机器同传的最新进展和面临的突出挑战。
除了干货十足的分享之外,本届研讨会还同期举办了机器同传评测。百度为本次较量公布了近 70 小时的实在场景演讲语音翻译数据集 BSTC(https://arxiv.org/abs/2104.03575)供参赛者进行模型训练和测试,涵盖信息技术、经济、文化、生物、艺术等多个畛域。本次较量吸引了来自中科院、北京理工大学、厦门大学、安全科技等多个队伍参赛。研讨会上,获胜团队将分享其最新技术成绩并进行在线交换。