微软 VALL-E X 零样本语音合成模型的开源实现。预训练模型现已向公众开放,供研究或应用使用。

新闻来源:VALL-E X —— 多语言文本到语音合成与语音克隆