微软开源TTS模型VibeVoice 能一次生成90分钟音频 微软开源TTS模型VibeVoice!能一次性生成90分钟音频,支持4人对话、中英文无缝切换。(1.5B,64K,90分钟;7B,32K,45分钟)

添加新评论