关于python:Python-人工智能-5秒钟偷走你的声音

介绍

Python 深度学习AI – 声音克隆、声音模拟，是一个三阶段的深度学习框架，容许从几秒钟的音频中创立语音的数字示意，并用它来调节文本到语音模型，该模型经过培训，能够概括到新的声音。

环境筹备与装置

原始英文版地址：

https://github.com/CorentinJ/…

中文二次开发版（本文应用该版本）：

https://github.com/babysor/Mo…

pycharm环境下载：

https://www.jetbrains.com/pyc…

conda虚拟环境：

https://www.anaconda.com/prod…

FFmpeg ：

https://github.com/BtbN/FFmpe…

模型文件：

https://pan.baidu.com/s/1PI-h… 提取码 2021

在电脑系统上装置 FFmpeg 工具

下载zip压缩包连贯为：https://github.com/BtbN/FFmpe…

下载实现后将其解压到一个目录后在零碎的环境变量中增加该目录

关上新的cmd中查看是否装置胜利

ffmpeg -version

应用关上我的项目目录后，创立时应用conda的Python 3.9虚拟环境

创立实现后，在cmd中查看现有的虚拟环境，并进入刚刚创立的虚拟环境

conda env list

activate pythonProject1

进入环境后在进行装置pip所需依赖，并应用国内源进行装置实现下载减速

pip install -r requirements.txt -i https://pypi.tuna.tsinghua.ed…

在虚拟环境下装置pytorch

pip install torch -i https://pypi.tuna.tsinghua.ed…

回到pycharm中，将模型导入到我的项目目录下，把目录复制黏贴到我的项目中

批改一行代码，在 synthesizer/utils/symbols.py 文件中

批改为：
_characters = 'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz12340!'(),-.:;? '

之后在terminal中启动工具箱

应用音频合成工具箱

Linux运维交换社区

Linux运维交换社区，互联网新闻以及技术交换。

48篇原创内容

公众号

https://blog.csdn.net/qq_3392…

https://my.oschina.net/u/3981543

https://www.zhihu.com/people/…

https://segmentfault.com/u/hp…

https://juejin.cn/user/331578…

https://space.bilibili.com/35…

https://cloud.tencent.com/dev…

知乎、CSDN、开源中国、思否、掘金、哔哩哔哩、腾讯云

本文应用文章同步助手同步

关于python:Python-人工智能-5秒钟偷走你的声音

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于python:Python-人工智能-5秒钟偷走你的声音

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复