已更新绿色整合版,无需手动安装python,开箱即用,打开运行.bat即可
五秒克隆你的声音
已整合训练好的模型,不需要特别高的配置和IT水平
环境要求
python3.7及以上
理论支持Windows 7及以上 (建议 win8+,过老版本不保证兼容性)
亲测win2012,win10完美运行
如果在用 pip 方式安装的时候出现 ERROR: Could not find a version that satisfies the
requirement torch==1.9.0+cu102 (from versions: 0.1.2, 0.1.2.post1,
0.1.2.post2) 这个错误可能是 python 版本过低,3.9 可以安装成功
安装步骤
请勾选add python to path,否则需要手动配置环境变量
请保持网络畅通,若断网报错请重新执行安装依赖.bat
使用教程
1.browse选择一段3-15秒的语音,wav格式,最好单声道,吐字清晰,没有杂音,不宜过长
亲测网课直播录屏,发语音,在安静条件录音等音质较好,而在公共环境比如舞台,KTV等录音音质较差
不是所有语音都能够完美克隆,亲测在网课放老师的声音以假乱真,但像麦小兜派蒙雷米等萝莉音效果不理想
可以使用音频编辑工具例如au进行预处理降噪
如图所示,频谱规则的音频克隆效果较好
如图所示,频谱不规则,克隆效果较差
2.在右上角输入文本,仅支持中文,不要有阿拉伯数字,英文请使用谐音自行解决哈
3.选择vocoder,推荐Griffin-Lim,点击Synthesize and vocode试听,之后点击export导出音频