1. 基础环境要求
- Python 版本:必须使用 Python 3.8 或更高版本。
- 操作系统支持:支持 Windows、Linux 以及 MacOS。
2. 依赖项安装
通用安装 (Windows/Linux)
- 首先通过
pip安装主要依赖项。 - 随后可以使用
poetry或继续使用pip安装其余依赖。
MacOS 安装
Mac 用户建议通过提供的 run.sh 脚本进行依赖安装。
3. FFmpeg 配置(核心组件)
FFmpeg 是音频处理的核心,如果系统中未安装,需按以下方式配置:
- Windows 用户:下载
ffmpeg.exe和ffprobe.exe并将其放置在 RVC 的 根目录 下。 - Ubuntu/Debian 用户:通过系统包管理器安装。
- MacOS 用户:建议使用
brew install ffmpeg进行安装。 - 注意:音频路径中若包含空格、括号或中文,可能会导致 FFmpeg 读取错误,建议使用简洁的英文路径。
4. 显卡(GPU)与硬件加速配置
NVIDIA 显卡
- 建议显存(VRAM)至少为 4GB。
- 虽然 2GB 或 3GB 的显存(如 1060 3G)仍有运行机会,但通常建议放弃,因为极易出现显存溢出(Cuda out of memory)。
- 对于 16 系列显卡,RVC 已解锁限制并提供了专门的 4GB 显存推理设置。
AMD 与 Intel 显卡
- 通过 Pytorch_DML 支持 AMD 和 Intel 显卡加速,适用于实时变声、推理和 UVR5 人声分离。
- Intel ARC 显卡还支持通过 IPEX 进行加速。
- 目前 AMD/Intel 显卡在训练功能上尚不完全支持,通常会切换至 CPU 训练。
Linux ROCm (AMD 专用)
Linux 用户若使用 AMD 显卡,需安装相应的驱动并可能需要设置特定的环境变量(如 RX6700XT)。
5. 预训练模型准备
RVC 的推理和训练都需要额外的预训练模型,无法直接从零开始。
- 下载途径:可以从 Huggingface 空间下载所需的模型文件。
- 模型版本:支持 v1 和 v2 版本的模型(如 32k、40k、48k 采样率)。
- 存放位置:默认会从
pretrained文件夹加载相应的权重文件,如f0G40k.pth等。
6. 常见环境问题修复
- llvmlite.dll 报错:这是 Windows 常见的环境问题,安装
vc_redist.x64.exe即可修复。 - WebUI 连接错误:如果遇到"Expecting value: line 1 column 1"报错,通常是由系统全局代理引起的,请 关闭系统 LAN 代理或全局代理 后刷新页面。
- 显存溢出优化:如果遇到 Cuda error,在训练时应减小
batch_size;在推理时应调整config.py中的x_pad、x_query等参数。