关于人工智能:首次开源一行代码轻松搞定中英文语音识别合成翻译核心功能

54次阅读

共计 1584 个字符,预计需要花费 4 分钟才能阅读完成。

导读 

要说生存里最常见的 AI 利用场景,语音合成与辨认当属大家最为耳熟能详的场景之一了。

寻常到平时地图导航的播报、微信语音转文字、手机语音输入,以及小度智能音箱,都离不开语音技术的加持。

语音技术到底是怎么实现的?有哪些现成可用的开源代码能够疾速集成到我的项目里?能够说是每一名开发者十分关怀的问题。

那么,福利工夫到了,明天这个集成了中英文语音辨认、语音翻译、语音合成、声音分类能力,而且一行代码轻松试验成果的开源我的项目,你肯定不能错过!

 我的项目介绍 

话不多说,先来看我的项目中给出的成果展现。

语音辨认

输出音频 1\

点击链接立刻查看:https://mp.weixin.qq.com/mp/a…\
辨认后果 1\
I knocked at the door on the ancient side of the building.

 

输出音频 2\

点击链接立刻查看:https://mp.weixin.qq.com/mp/a…

辨认后果 2\
我认为跑步最重要的就是给我带来了身体健康。

语音翻译(英译中)\
输出音频 \

点击链接立刻查看:https://mp.weixin.qq.com/mp/a…

辨认后果

我在这栋修建的古老门上敲门。

语音合成 \
输出文本 1\
Life was like a box of chocolates, you never know what you’re gonna get.

合成音频 1\

点击链接立刻查看:https://mp.weixin.qq.com/mp/a…

输出文本 2\
早上好,明天是 2020/10/29,最低温度是 -3°C。

合成音频 2\

点击链接立刻查看:https://mp.weixin.qq.com/mp/a…

能够看到,无论是中英文的辨认,还是中英文的合成,这个开源我的项目都有不错的成果,特地的,我的项目中还蕴含了语音翻译能力,能够实现英文语音同传翻译为中文字幕,这个的确太强大了。

传送门:

GitHub 地址:https://github.com/PaddlePadd…

有读者必定想问,这么弱小的语音能力,是不是想要用起来比拟麻烦?

不得不说,这个我的项目在易用性上真的也是思考得十分周到。

 装置测试成果 

依照首页的疏导:

一行命令装置:

一行命令疾速开始应用:

这里,能够抱着试一试的态度,在本机上安装了这个我的项目,装置实现之后,先应用语音合成试一下。

生成的成果大家能够听一下~

点击链接立刻查看:https://mp.weixin.qq.com/mp/a…

而后,带着好奇心,再把合成的后果送到语音辨认试一下,看看成果:

最终输入后果:

能够看到,这一套循环下来,成果十分不错!

除了杰出的成果,易用的体验,咱们再看看这个我的项目中还有什么宝藏能够开掘,果然咱们发现我的项目中还蕴含丰盛的预训练模型,并且语音辨认和语音合成均反对自定义训练。

 丰盛的预训练模型 

语音辨认蕴含声学模型和语言模型,详情如下:

语音合成次要蕴含三个模块:文本前端、声学模型和声码器。

声学模型和声码器模型如下:

 欠缺的文档教程 

并且开源以来,收到开发者的宽泛关注,曾经有大量开发者投入到我的项目的建设中并且奉献内容。

真·干货满满!

别的不须要多说了,请大家拜访 GitHub 亲自体验吧:

https://github.com/PaddlePadd…

如果大家称心的话,欢送点个小星星激励下咱们的工程师!

百度 AI 开发者社区 https://ai.baidu.com/forum?&h…,为全国各地开发者提供一个交换、分享、答疑解惑的平台,让开发者在研发路上不再“孤军奋战”,通过一直地交换与探讨找出更好的技术解决方案。如果你想尝试各种人工智能技术、开辟利用场景,赶快退出百度 AI 社区,你对 AI 的所有畅想,在这里都能够实现!

扫描下方二维码,增加小助手微信「京东卡、小度定制周边、神秘礼盒、行李箱」等更多福利你来拿~

正文完
 0