共计 1062 个字符,预计需要花费 3 分钟才能阅读完成。
2022 年 6 月,HMS Core 机器学习服务面向开发者提供一项全新的凋谢能力——同声传译,通过 AI 语音技术缩小资源老本,增强沟通交流,旨在帮忙开发者制作丰盛多样的同声传译利用。
HMS Core 同声传译涵盖了机器学习服务的 [语音辨认、翻译、语音合成]() 等核心技术,首先把输出的实时语音转换成文字,而后再把文字翻译成另一种语言的文字,最初把翻译后的文字转换成语音播放。同声传译能力 可能帮助解决多种场景下的跨语言实时交换,反对中英文互译,提供多种音色语音播报,能够广泛应用于畛域多样、环境简单、实时性高的会议、直播等场景。
语音辨认 + 机器翻译,兼具品质与效率
对于同声传译而言,精确的源语言输出 + 译文输入是其重要的衡量标准。而在面对同声传译次要的场景——大会演讲、字幕直播、会议访谈、智慧教育……往往随同长时间继续输出的音频,端侧辨认通过语音能量检测、静音检测、心跳检测等算法,实现长音频的无效断句,从而将无效语音片段送到语音辨认模块,晋升了语音辨认的效率,同时放大了同声传译时延,升高噪声对辨认成果的影响。
另一方面,在语音转成文本后,存在局部辨认谬误、口语化表白、语气词较多、局部内容反复表白等导致文本不流畅以及辨认文本并未进行粗疏断句的问题。针对这些情况,机器学习服务在文本处理模块采纳 NLP 语义了解、同音歧义解决、环境声音解决、口语化解决等纠错技术,来实现文本顺滑、主动断句等性能,确保返回高质量的翻译文本,从而实现语音辨认和翻译性能增强,晋升同声传译成果。
多种场景全笼罩,中英字幕双语输入
同声传译既能利用在面对面跨语言交换场景,也能在近程沟通中发挥作用。无论是面对面多语种会议、近程会议、还是观看外语视频,同声传译能力能够实时生成双语字幕,升高了解老本,晋升工作与学习效率。
定制化语音播报,边听边看两不误
同声传译能力通过先进的深度神经合成技术,可能实时输入音频流数据,同时提供多种中、英文男、女音色抉择,从而使发音达到更加实在天然的成果。通过实时语音播报升高提早,联合实时字幕内容,为参会者提供视听一体的沉迷式同声传译体验。
通过对语音辨认、机器翻译、语音合成三项技术的有机整合,HMS Core 机器学习服务为开发者提供较低时延、较高准确率的同声传译能力,帮忙用户更顺畅地进行国际交流,打造同声传译新“声”态。欢送开发者能够登录机器学习服务主页,理解更具体的产品介绍与接入筹备。
理解更多详情 >>
拜访华为开发者联盟官网
获取开发领导文档
华为挪动服务开源仓库地址:GitHub、Gitee
关注咱们,第一工夫理解 HMS Core 最新技术资讯~