1. 启动实时变声引擎
RVC 专门为实时交互开发了小型 GUI 界面。您可以通过双击根目录下的 go-realtime-gui.bat 文件直接启动实时变声迷你 GUI。
2. 硬件与性能配置
- 延迟表现:RVC 的端到端延迟通常为 170ms。若要追求极致体验,通过使用 ASIO 输入和输出设备,延迟可以进一步降低至 90ms,但这高度依赖于您的硬件驱动支持。
- 设备匹配:这是成功运行的关键——输入设备和输出设备必须选择相同的类型(例如,如果输入选择了 MME,输出也必须选择 MME)。
- 显卡支持:除了 NVIDIA 显卡,RVC 还通过 Pytorch_DML 支持 AMD 和 Intel 显卡加速。对于 4GB 显存的显卡(如 16 系列),RVC 已解锁限制并提供了专门的推理设置。
3. 核心算法选择
在实时变声中,建议首选 RMVPE 模型进行音高提取。相比于传统的 Crepe 算法,RMVPE 具有以下优势:
- 音质更佳:能有效解决变声过程中的"哑音"问题。
- 更轻量:资源消耗更低,且推理速度更快。
- 兼容性强:支持通过 Onnx_Dml 进行 GPU 推理。
4. 音效与质量调优
检索比例(Index Rate)
该参数用于平衡"模型音色"与"源声特征":
- 减少音色泄漏:调高检索比例(最高为 1)可以使音色更偏向训练集,减少输入源声音色的干扰。
- 平衡画质:如果训练集质量较低,适当调低此值可以防止音质受损。
保护措施
RVC 支持 清音和呼吸保护模式,并对 50Hz 以下的频率进行过滤,以确保低音部分的清晰度。
音量调节
系统支持使用输入音量包络线来混合或替换输出包络线,这能有效缓解"输入静音时输出产生小幅噪声"的问题。
5. 常见问题排查
- 连接错误/报错:如果 WebUI 提示
Expecting value: line 1 column 1,通常是因为开启了系统全局代理,请关闭代理后重试。 - CPU 占用过高:RVC 已优化了实时变声中 faiss 搜索导致的 CPU 消耗问题,确保运行流畅。
- 依赖缺失:Windows 用户如果遇到
llvmlite.dll无法加载的错误,需安装官方指定的 VC 重分发程序(vc_redist.x64.exe)。 - FFmpeg 错误:确保
ffmpeg.exe和ffprobe.exe放置在根目录下,且音频路径中不含空格、括号或中文,以免读取失败。