今天教大家如何训练自己的语音模型,文本转成自己的语音,克隆自己的声音。让生成的效果更自然,更像自己的声音。此教程适合新手没有编程经验的朋友。
1.首先打开百度Ai飞桨PaddleSpeech网址,
注册、实名认证
https://aistudio.baidu.com/aistudio/projectdetail/5003396
2.点击下图的【运行一下】
3.点击【启动环境】,会弹出选择框,必须使用GPU环境,建议使用 32G的GPU环境运行,下图红框的三个都可以,我选择的是第一个。1.0点/小时
4.进入环境
5.下拉找到【安装试验所需环境】这个目录
然后点击箭头这个按钮进行环境安装。
等待一两分钟即可。完成后会显示:运行时长、结束时间。
运行完成才能操作。
每次启动都是需要先运行一次的。
6.双击左侧文件列表的untitled.streamlit.py
,然后点击浏览器打开
7.用手机或者软件录制至少五段自己的语音。需要没有杂音,声音清晰。
我用的手机录的视频,用格式工厂转wav格式音频上传的。
8.点击【效验数据】,如果效验有问题,就替换声音,重新录
9.训练步数,文档有详细的说明,按照说明操作即可
训练完成后可以选择导出下载生成的声音模型。
10.生成语音
输入文本后【合成】
如果需要帧级别调整音素长度进行语音合成,需要点击fun_exp1.streamlit.py
文件进去修改
点击【生成Suration】按钮
其他详细说明看看里面的文档吧。
© 版权声明
THE END
暂无评论内容