GPT-SoVITS

1年前更新 6,274 0 0

GPT-SoVITS 是一个强大的语音转换和文本转语音（TTS）工具，支持零样本和少样本语音克隆

收录时间：

2024-06-06

打开网站手机查看

GPT-SoVITS

打开网站

### GPT-SoVITS 项目简介

**项目地址**: [GitHub – RVC-Boss/GPT-SoVITS]

**项目简介**:
GPT-SoVITS 是一个强大的语音转换和文本转语音（TTS）工具，支持零样本和少样本语音克隆。它能够在短时间内生成高质量的语音，适用于多种语言环境，特别是中文、英语和日语。

**主要特点**:
1. **零样本 TTS**：输入 5 秒钟的语音样本即可进行即时文本转语音转换。
2. **少样本 TTS**：只需 1 分钟的训练数据即可对模型进行微调，提升语音相似度和真实感。
3. **跨语言支持**：支持在不同语言之间进行推理，包括中文、日语和英语。
4. **WebUI 工具**：集成了语音伴奏分离、自动训练集分割、中文自动语音识别（ASR）和文本标注等工具，帮助初学者创建训练数据集和 GPT/SoVITS 模型。

**安装说明**:
– 支持在 Windows、Linux 和 macOS 系统上运行。
– 需要安装 Python 和 PyTorch，并配置必要的依赖项。
– 提供 Docker 支持，方便用户快速部署。

**高优先级任务**:
– 日语和英语的数据集微调训练。
– 增强 TTS 情感控制。
– 开发更大和更小的 TTS 模型。

**使用场景**:
– 小说朗读
– 视频配音
– 语音助手

GPT-SoVITS 通过少量的语音数据即可训练出高质量的文本转语音模型，具有广泛的应用前景。

项目地址：
GitHub – RVC-Boss/GPT-SoVITS: 1 min voice data can also be used to train a good TTS model! (few shot voice cloning)

数据统计

GPT-SoVITS

数据统计

相关导航

ChatTTS

ViewCrafter

F5-TTS

Reecho 睿声

Animate-X

OpenVoice

Qwen2.5-Math

FunClip自动化视频剪辑工具