VALL-E X可以通过仅使用未曾见过的说话者的3秒录音作为声学提示,合成高质量的个性化语音,即使是对于一位母语讲者,也可以在另一种语言中执行。此实现支持三种语言(英语、中文、日语)的零尝试、单语/跨语言文本到语音功能。

VALL_E_X语音克隆带6款模型-整合版

上传一个持续3到10秒的语音作为音频提示,并键入您想要合成的文本。

模型将用您的音频提示相同的声音合成给定文本的语音。

该模型还倾向于保留您给定语音的情感和声学环境。

下载地址:https://www.123pan.com/s/b5viVv-jUA8d.html

The End 微信扫一扫

文章声明:以上内容(如有图片或视频亦包括在内)除非注明,否则均为70资源博客原创文章,转载或复制请以超链接形式并注明出处。

上一篇 下一篇

相关阅读

发表评论

访客 访客
快捷回复: 表情:
验证码
评论列表 (暂无评论,23人围观)

还没有评论,来说两句吧...

取消
微信二维码
微信二维码
支付宝二维码