1. 基础环境要求

  • Python 版本:必须使用 Python 3.8 或更高版本。
  • 操作系统支持:支持 Windows、Linux 以及 MacOS。

2. 依赖项安装

通用安装 (Windows/Linux)

  • 首先通过 pip 安装主要依赖项。
  • 随后可以使用 poetry 或继续使用 pip 安装其余依赖。

MacOS 安装

Mac 用户建议通过提供的 run.sh 脚本进行依赖安装。

3. FFmpeg 配置(核心组件)

FFmpeg 是音频处理的核心,如果系统中未安装,需按以下方式配置:

  • Windows 用户:下载 ffmpeg.exeffprobe.exe 并将其放置在 RVC 的 根目录 下。
  • Ubuntu/Debian 用户:通过系统包管理器安装。
  • MacOS 用户:建议使用 brew install ffmpeg 进行安装。
  • 注意:音频路径中若包含空格、括号或中文,可能会导致 FFmpeg 读取错误,建议使用简洁的英文路径。

4. 显卡(GPU)与硬件加速配置

NVIDIA 显卡

  • 建议显存(VRAM)至少为 4GB
  • 虽然 2GB 或 3GB 的显存(如 1060 3G)仍有运行机会,但通常建议放弃,因为极易出现显存溢出(Cuda out of memory)。
  • 对于 16 系列显卡,RVC 已解锁限制并提供了专门的 4GB 显存推理设置。

AMD 与 Intel 显卡

  • 通过 Pytorch_DML 支持 AMD 和 Intel 显卡加速,适用于实时变声、推理和 UVR5 人声分离。
  • Intel ARC 显卡还支持通过 IPEX 进行加速。
  • 目前 AMD/Intel 显卡在训练功能上尚不完全支持,通常会切换至 CPU 训练。

Linux ROCm (AMD 专用)

Linux 用户若使用 AMD 显卡,需安装相应的驱动并可能需要设置特定的环境变量(如 RX6700XT)。

5. 预训练模型准备

RVC 的推理和训练都需要额外的预训练模型,无法直接从零开始。

  • 下载途径:可以从 Huggingface 空间下载所需的模型文件。
  • 模型版本:支持 v1 和 v2 版本的模型(如 32k、40k、48k 采样率)。
  • 存放位置:默认会从 pretrained 文件夹加载相应的权重文件,如 f0G40k.pth 等。

6. 常见环境问题修复

  • llvmlite.dll 报错:这是 Windows 常见的环境问题,安装 vc_redist.x64.exe 即可修复。
  • WebUI 连接错误:如果遇到"Expecting value: line 1 column 1"报错,通常是由系统全局代理引起的,请 关闭系统 LAN 代理或全局代理 后刷新页面。
  • 显存溢出优化:如果遇到 Cuda error,在训练时应减小 batch_size;在推理时应调整 config.py 中的 x_padx_query 等参数。
📖 更多帮助:返回 常见问题总览 查看更多解答,或查看 实时变声操作指南 了解低延迟配置技巧。