本教程基于 RVC 官方文档,为您提供针对 Windows 系统的全流程安装与配置指南。RVC(Retrieval-based Voice Conversion)是一款基于 VITS 的高性能变声框架,支持实时变声与模型训练。
一、硬件与系统要求
在安装前,请确保您的电脑符合以下规格:
- 操作系统:Windows 10/11。
- 显卡 (GPU):
- NVIDIA:建议显存 4GB 及以上。RVC 已为 16 系列显卡优化,并提供 4GB 显存专用设置。
- AMD/Intel:支持通过 Pytorch_DML 加速推理及实时变声(训练暂不支持,会切换至 CPU)。
- 环境依赖:必须安装 Python 3.8 或更高版本。
二、环境准备:安装核心依赖
1. 安装 FFmpeg(必须步骤)
FFmpeg 是音频处理的核心组件。如果未配置,RVC 将无法读取音频文件。
- 操作:下载
ffmpeg.exe和ffprobe.exe,并将这两个文件直接放置在 RVC 的根目录下。 - 注意:请确保您的 RVC 存放路径不包含空格、括号或中文,否则 FFmpeg 极易报错。
2. 修复 dll 缺失报错
Windows 用户常会遇到 llvmlite.dll 无法加载的错误。
- 解决:下载并安装 Microsoft Visual C++ Redistributable(
vc_redist.x64.exe)。
三、软件安装:两种安装方式
方式 A:使用集成包(推荐新手使用)
- 下载官方提供的
RVC-beta.7z压缩包。 - 解压到一个全英文路径的文件夹中。
- 启动 WebUI:直接双击运行根目录下的
go-web.bat。 - 启动实时变声:若需直播变声,双击运行
go-realtime-gui.bat。
方式 B:手动通过 Pip 安装(开发者推荐)
如果您习惯手动配置环境,请按顺序执行:
- 安装主要依赖:
pip install -r requirements.txt。 - (可选)使用
poetry安装其余依赖。
四、快速上手:加载模型与变声
1. 模型加载
- 将下载的
.pth模型文件放入weights文件夹。 - 将对应的
.index特征文件放入logs/你的实验名文件夹。 - 在 WebUI 页面点击"刷新音色列表 (Refresh timbre list)",即可在下拉菜单中看到模型。
2. 实时变声配置
- 打开
go-realtime-gui.bat。 - 核心准则:输入和输出设备必须选择相同类型(例如:输入是 MME,输出也必须是 MME)。
- 性能:默认端到端延迟约为 170ms;若使用 ASIO 设备,延迟可优化至 90ms。
五、常见报错与避坑指南 (FAQ)
- Q: 弹出 "Expecting value: line 1 column 1" 错误?
- 原因:通常是由于开启了系统全局代理。
- 解决:关闭系统 LAN 代理/全局代理,然后重新刷新页面。
- Q: 显存溢出 (Cuda out of memory)?
- 解决:训练时减小
batch_size;推理时在config.py中尝试调小x_pad、x_query等参数。
- 解决:训练时减小
- Q: 找不到模型?
- 原因:可能是误用了几百 MB 的训练断点文件。
- 解决:请确保使用的是位于
weights文件夹下约 60MB+ 的最终提取模型。