共计 1584 个字符,预计需要花费 4 分钟才能阅读完成。
导读
要说生存里最常见的 AI 利用场景,语音合成与辨认当属大家最为耳熟能详的场景之一了。
寻常到平时地图导航的播报、微信语音转文字、手机语音输入,以及小度智能音箱,都离不开语音技术的加持。
语音技术到底是怎么实现的?有哪些现成可用的开源代码能够疾速集成到我的项目里?能够说是每一名开发者十分关怀的问题。
那么,福利工夫到了,明天这个集成了中英文语音辨认、语音翻译、语音合成、声音分类能力,而且一行代码轻松试验成果的开源我的项目,你肯定不能错过!
我的项目介绍
话不多说,先来看我的项目中给出的成果展现。
语音辨认
输出音频 1\
点击链接立刻查看:https://mp.weixin.qq.com/mp/a…\
辨认后果 1\
I knocked at the door on the ancient side of the building.
输出音频 2\
点击链接立刻查看:https://mp.weixin.qq.com/mp/a…
辨认后果 2\
我认为跑步最重要的就是给我带来了身体健康。
语音翻译(英译中)\
输出音频 \
点击链接立刻查看:https://mp.weixin.qq.com/mp/a…
辨认后果
我在这栋修建的古老门上敲门。
语音合成 \
输出文本 1\
Life was like a box of chocolates, you never know what you’re gonna get.
合成音频 1\
点击链接立刻查看:https://mp.weixin.qq.com/mp/a…
输出文本 2\
早上好,明天是 2020/10/29,最低温度是 -3°C。
合成音频 2\
点击链接立刻查看:https://mp.weixin.qq.com/mp/a…
能够看到,无论是中英文的辨认,还是中英文的合成,这个开源我的项目都有不错的成果,特地的,我的项目中还蕴含了语音翻译能力,能够实现英文语音同传翻译为中文字幕,这个的确太强大了。
传送门:
GitHub 地址:https://github.com/PaddlePadd…
有读者必定想问,这么弱小的语音能力,是不是想要用起来比拟麻烦?
不得不说,这个我的项目在易用性上真的也是思考得十分周到。
装置测试成果
依照首页的疏导:
一行命令装置:
一行命令疾速开始应用:
这里,能够抱着试一试的态度,在本机上安装了这个我的项目,装置实现之后,先应用语音合成试一下。
生成的成果大家能够听一下~
点击链接立刻查看:https://mp.weixin.qq.com/mp/a…
而后,带着好奇心,再把合成的后果送到语音辨认试一下,看看成果:
最终输入后果:
能够看到,这一套循环下来,成果十分不错!
除了杰出的成果,易用的体验,咱们再看看这个我的项目中还有什么宝藏能够开掘,果然咱们发现我的项目中还蕴含丰盛的预训练模型,并且语音辨认和语音合成均反对自定义训练。
丰盛的预训练模型
语音辨认蕴含声学模型和语言模型,详情如下:
语音合成次要蕴含三个模块:文本前端、声学模型和声码器。
声学模型和声码器模型如下:
欠缺的文档教程
并且开源以来,收到开发者的宽泛关注,曾经有大量开发者投入到我的项目的建设中并且奉献内容。
真·干货满满!
别的不须要多说了,请大家拜访 GitHub 亲自体验吧:
https://github.com/PaddlePadd…
如果大家称心的话,欢送点个小星星激励下咱们的工程师!
百度 AI 开发者社区 https://ai.baidu.com/forum?&h…,为全国各地开发者提供一个交换、分享、答疑解惑的平台,让开发者在研发路上不再“孤军奋战”,通过一直地交换与探讨找出更好的技术解决方案。如果你想尝试各种人工智能技术、开辟利用场景,赶快退出百度 AI 社区,你对 AI 的所有畅想,在这里都能够实现!
扫描下方二维码,增加小助手微信「京东卡、小度定制周边、神秘礼盒、行李箱」等更多福利你来拿~