共计 1235 个字符,预计需要花费 4 分钟才能阅读完成。
介绍
Python 深度学习 AI – 声音克隆、声音模拟,是一个三阶段的深度学习框架,容许从几秒钟的音频中创立语音的数字示意,并用它来调节文本到语音模型,该模型经过培训,能够概括到新的声音。
环境筹备与装置
原始英文版地址:
https://github.com/CorentinJ/…
中文二次开发版(本文应用该版本):
https://github.com/babysor/Mo…
pycharm 环境下载:
https://www.jetbrains.com/pyc…
conda 虚拟环境:
https://www.anaconda.com/prod…
FFmpeg:
https://github.com/BtbN/FFmpe…
模型文件:
https://pan.baidu.com/s/1PI-h… 提取码 2021
在电脑系统上装置 FFmpeg 工具
下载 zip 压缩包连贯为:https://github.com/BtbN/FFmpe…
下载实现后将其解压到一个目录后在零碎的环境变量中增加该目录
关上新的 cmd 中查看是否装置胜利
ffmpeg -version
应用关上我的项目目录后,创立时应用 conda 的 Python 3.9 虚拟环境
创立实现后,在 cmd 中查看现有的虚拟环境,并进入刚刚创立的虚拟环境
conda env list
activate pythonProject1
进入环境后在进行装置 pip 所需依赖,并应用国内源进行装置实现下载减速
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.ed…
在虚拟环境下装置 pytorch
pip install torch -i https://pypi.tuna.tsinghua.ed…
回到 pycharm 中,将模型导入到我的项目目录下,把目录复制黏贴到我的项目中
批改一行代码,在 synthesizer/utils/symbols.py 文件中
批改为:_characters = 'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz12340!'(),-.:;? '
之后在 terminal 中启动工具箱
应用音频合成工具箱
Linux 运维交换社区
Linux 运维交换社区,互联网新闻以及技术交换。
48 篇原创内容
公众号
https://blog.csdn.net/qq_3392…
https://my.oschina.net/u/3981543
https://www.zhihu.com/people/…
https://segmentfault.com/u/hp…
https://juejin.cn/user/331578…
https://space.bilibili.com/35…
https://cloud.tencent.com/dev…
知乎、CSDN、开源中国、思否、掘金、哔哩哔哩、腾讯云
本文应用 文章同步助手 同步