本教程基于 RVC 官方文档,为您提供针对 Windows 系统的全流程安装与配置指南。RVC(Retrieval-based Voice Conversion)是一款基于 VITS 的高性能变声框架,支持实时变声与模型训练。

一、硬件与系统要求

在安装前,请确保您的电脑符合以下规格:

  • 操作系统:Windows 10/11。
  • 显卡 (GPU)
    • NVIDIA:建议显存 4GB 及以上。RVC 已为 16 系列显卡优化,并提供 4GB 显存专用设置。
    • AMD/Intel:支持通过 Pytorch_DML 加速推理及实时变声(训练暂不支持,会切换至 CPU)。
  • 环境依赖:必须安装 Python 3.8 或更高版本

二、环境准备:安装核心依赖

1. 安装 FFmpeg(必须步骤)

FFmpeg 是音频处理的核心组件。如果未配置,RVC 将无法读取音频文件。

  • 操作:下载 ffmpeg.exeffprobe.exe,并将这两个文件直接放置在 RVC 的根目录下。
  • 注意:请确保您的 RVC 存放路径不包含空格、括号或中文,否则 FFmpeg 极易报错。

2. 修复 dll 缺失报错

Windows 用户常会遇到 llvmlite.dll 无法加载的错误。

  • 解决:下载并安装 Microsoft Visual C++ Redistributable(vc_redist.x64.exe)。

三、软件安装:两种安装方式

方式 A:使用集成包(推荐新手使用)

  1. 下载官方提供的 RVC-beta.7z 压缩包。
  2. 解压到一个全英文路径的文件夹中。
  3. 启动 WebUI:直接双击运行根目录下的 go-web.bat
  4. 启动实时变声:若需直播变声,双击运行 go-realtime-gui.bat

方式 B:手动通过 Pip 安装(开发者推荐)

如果您习惯手动配置环境,请按顺序执行:

  1. 安装主要依赖:pip install -r requirements.txt
  2. (可选)使用 poetry 安装其余依赖。

四、快速上手:加载模型与变声

1. 模型加载

  • 将下载的 .pth 模型文件放入 weights 文件夹。
  • 将对应的 .index 特征文件放入 logs/你的实验名 文件夹。
  • 在 WebUI 页面点击"刷新音色列表 (Refresh timbre list)",即可在下拉菜单中看到模型。

2. 实时变声配置

  • 打开 go-realtime-gui.bat
  • 核心准则:输入和输出设备必须选择相同类型(例如:输入是 MME,输出也必须是 MME)。
  • 性能:默认端到端延迟约为 170ms;若使用 ASIO 设备,延迟可优化至 90ms

五、常见报错与避坑指南 (FAQ)

  • Q: 弹出 "Expecting value: line 1 column 1" 错误?
    • 原因:通常是由于开启了系统全局代理。
    • 解决关闭系统 LAN 代理/全局代理,然后重新刷新页面。
  • Q: 显存溢出 (Cuda out of memory)?
    • 解决:训练时减小 batch_size;推理时在 config.py 中尝试调小 x_padx_query 等参数。
  • Q: 找不到模型?
    • 原因:可能是误用了几百 MB 的训练断点文件。
    • 解决:请确保使用的是位于 weights 文件夹下约 60MB+ 的最终提取模型。
📖 延伸阅读:查看 运行环境配置指南 了解详细的硬件与依赖配置,或查看 实时变声操作指南 优化你的变声体验。