关于android:HMS-Core-Discovery第16期回顾与虎墩一起玩转AI新声态

31次阅读

共计 1615 个字符,预计需要花费 5 分钟才能阅读完成。

HMS Core 在 AI 畛域最新的技术能力有哪些?本期 Discovery 直播以《与虎墩一起,玩转 AI 新“声”态》为主题,邀请了 HMS Core 机器学习服务产品经理、机器翻译高级专家以及 HMS Core 的新敌人“虎墩”,为大家展现机器学习的语音语言翻新技术,分享机器学习与人工智能的宏观发展趋势。一起回顾一下本期精彩内容!

【精彩回顾】

1、抖音网红 IP“虎墩小镖师”强势来袭

2、同声传译新亮相,底层技术大揭秘

3、AI 翻译能力降级,语种裁减可播报

【专家观点】

Nicolas,华为 2012 实验室文本机器翻译高级专家

机器翻译临时无奈代替人类。目前需要不高的翻译需要能够依赖机器但要求较高的翻译需要还须要人工染指,人工能够做到点到面的全方位品质把控,比方谈话纯粹与否、语言通顺与否,还能够奉献数据和常识,晋升机器翻译品质。

Hardy,HMS Core ML Kit 资深产品经理

AI 是智能机器的狭义畛域,而机器学习是 AI 的外围利用之一。它指的是任何可能自行“学习”的计算机应用程序或程序,而无需人类的明确规定。将来机器学习技术将会更重视情感体验,向多模态(语音、文字、视觉)、多技术(VR/AR 等)、多平台多零碎协同态势的方向倒退。

【精彩答疑】

Q1:什么是 TTS 音色定制?TTS 音色定制与虎墩在碰撞一起会有什么新玩法?

A:依靠华为的数据积攒和成熟算法,TTS 音色定制在语音合成技术的加持下,只须要提供大量的洁净录音数据,就能够进行模型训练,失去 高还原度、高清晰度、高稳定性 的专属音库,助于晋升产品特色、疾速打造个性化的品牌特色。ML Kit 的新能力 TTS 与 IP“虎墩小镖师”正在单干中,TTS 通过机器训练还原虎墩的音色,后续将逐渐 凋谢虎墩音色 给开发者应用,助力开发者利用在各类个性化场景。

Q2:机器学习服务提供的翻译和同声传译能力,如何赋能 App 打造新“声”态?

A:文本翻译能力解决了用户因语言不通而导致交换不畅的痛点。比方通话场景,通过实时语音辨认,能够 疾速将辨认的文字转化为指标语言文字 ;浏览场景,反对 提词翻译器性能 ,帮忙用户快捷看到译文;视频类 App 集成文本翻译服务后,用户能够晦涩体验AI 实时字幕性能。通过对语音辨认、机器翻译、语音合成三项技术的有机整合, 同声传译能力有较低时延、较高准确率 的个性,实用于会议、直播、演讲等实时性高的场景,反对利用将音频内容实时输入为指标语言文字,生成双语字幕,同时对目标语言文本进行实时播报,升高了解老本,兼具品质与效率。

Q3:除以上语音语言类能力,机器学习服务有新推出其它创新能力吗?

A:在金融电商畛域,机器学习服务还提供了活体检测能力。动作活体检测能力应用人脸关键点定位和人脸追踪等技术,通过指令配合动作的模式能够验证用户是否为实在活体自己操作。在银行、证券和借贷等实名制和安全性要求较高的金融畛域,活体检测可作为用户近程注册和密码找回环节中的辅助验证,帮忙用户甄别欺诈行为,无效抵挡攻击行为,保障业务平安。

Q4:机器学习的宏观技术发展趋势是怎么的?

A:首先,机器学习会更加 重视情感体验 。机器将具备辨认、了解和表白喜怒哀乐的能力,辨认用户的需要以及环境信息的变动,了解人的情感用意,做出适当反馈;其次,是 多模态的倒退 。深度学习技术正从语音、文字、视觉等单模态向学习多模态智能学习倒退。将来甚至能够对嗅觉、味觉、心理学等难以量化的信号进行交融,实现多个模态的联结剖析,在更多场景、更多业务上辅助人类工作;再次, 是多技术的交融 ,比方 VR/AR 以及元宇宙等。置信将来 AI 还将出现 多平台多零碎协同 态势,以实现更为宽泛的赋能,将通用平台、行业平台和端侧利用的协同组合,以软硬一体的形式实现具体利用的性能定制和扩大。

欢送登录 HMS Core 机器学习服务首页理解更多技术细节。

理解更多详情 >>

拜访华为开发者联盟官网
获取开发领导文档
华为挪动服务开源仓库地址:GitHub、Gitee

关注咱们,第一工夫理解 HMS Core 最新技术资讯~

正文完
 0