1. 启动实时变声引擎

RVC 专门为实时交互开发了小型 GUI 界面。您可以通过双击根目录下的 go-realtime-gui.bat 文件直接启动实时变声迷你 GUI。

2. 硬件与性能配置

  • 延迟表现:RVC 的端到端延迟通常为 170ms。若要追求极致体验,通过使用 ASIO 输入和输出设备,延迟可以进一步降低至 90ms,但这高度依赖于您的硬件驱动支持。
  • 设备匹配这是成功运行的关键——输入设备和输出设备必须选择相同的类型(例如,如果输入选择了 MME,输出也必须选择 MME)。
  • 显卡支持:除了 NVIDIA 显卡,RVC 还通过 Pytorch_DML 支持 AMD 和 Intel 显卡加速。对于 4GB 显存的显卡(如 16 系列),RVC 已解锁限制并提供了专门的推理设置。

3. 核心算法选择

在实时变声中,建议首选 RMVPE 模型进行音高提取。相比于传统的 Crepe 算法,RMVPE 具有以下优势:

  • 音质更佳:能有效解决变声过程中的"哑音"问题。
  • 更轻量:资源消耗更低,且推理速度更快。
  • 兼容性强:支持通过 Onnx_Dml 进行 GPU 推理。

4. 音效与质量调优

检索比例(Index Rate)

该参数用于平衡"模型音色"与"源声特征":

  • 减少音色泄漏:调高检索比例(最高为 1)可以使音色更偏向训练集,减少输入源声音色的干扰。
  • 平衡画质:如果训练集质量较低,适当调低此值可以防止音质受损。

保护措施

RVC 支持 清音和呼吸保护模式,并对 50Hz 以下的频率进行过滤,以确保低音部分的清晰度。

音量调节

系统支持使用输入音量包络线来混合或替换输出包络线,这能有效缓解"输入静音时输出产生小幅噪声"的问题。

5. 常见问题排查

  • 连接错误/报错:如果 WebUI 提示 Expecting value: line 1 column 1,通常是因为开启了系统全局代理,请关闭代理后重试。
  • CPU 占用过高:RVC 已优化了实时变声中 faiss 搜索导致的 CPU 消耗问题,确保运行流畅。
  • 依赖缺失:Windows 用户如果遇到 llvmlite.dll 无法加载的错误,需安装官方指定的 VC 重分发程序(vc_redist.x64.exe)。
  • FFmpeg 错误:确保 ffmpeg.exeffprobe.exe 放置在根目录下,且音频路径中不含空格、括号或中文,以免读取失败。
📖 更多帮助:返回 常见问题总览 查看更多解答,或前往 安装使用教程 了解完整配置流程。