字节跳动团队推出新型语音生成模型Seed-TTS,能生成自然且表现力丰富的语音。
Seed-TTS 是 ByteDance 开发的一系列文本转语音(TTS)模型,可以生成听起来非常像人类的语音。它的特点和主要内容如下:
项目及演示:https://bytedancespeech.github.io/seedtts_tech_report/
论文:https://arxiv.org/pdf/2406.02430
GitHub:https://github.com/BytedanceSpeech/seed-tts-eval/