Windows 高效部署 GeneFace++ 实操指南
一 环境准备与版本匹配
- 操作系统与权限:使用 Windows 10/11 64 位,以管理员权限安装软件与环境变量,避免权限导致的构建失败。
- Python 与虚拟环境:建议 Python 3.8/3.9,用 conda 或 venv 隔离环境,减少依赖冲突。
- 编译工具:安装 Visual Studio Build Tools 2019/2022,勾选 C++ 桌面开发 工作负载(含 MSVC、Windows SDK)。
- 多媒体工具:安装 ffmpeg 并将 ffmpeg/ffprobe 加入 PATH,用于音视频编解码。
- GPU 驱动与 CUDA:更新 NVIDIA 驱动;如需 GPU 加速,安装与 PyTorch 版本匹配的 CUDA Toolkit 与 cuDNN,并确认 GPU 架构(如 RTX 30/40 系列为 Ampere)受支持。
- 硬件建议:CPU ≥4 核 2GHz,内存 ≥8GB(推荐 16GB+),可用磁盘 ≥20GB(便于缓存与模型权重)。
二 一键化安装流程(CPU 先行,GPU 后补)
- 获取代码与进入目录:
- git clone https://github.com/your-repo/GeneFace++.git
- cd GeneFace++
- 创建并激活环境(示例用 conda):
- conda create -n geneface_env python=3.8 -y
- conda activate geneface_env
- 安装基础依赖:
- pip install -U pip
- pip install numpy opencv-python
- 安装 PyTorch(CPU 版,先行验证环境):
- pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cpu
- 若含 C/C++/CUDA 扩展,使用 CMake 构建(Release 模式性能更佳):
- mkdir build && cd build
- cmake .. -G "Visual Studio 16 2019" -A x64 -DPYTHON_EXECUTABLE="%CONDA_PREFIX%\python.exe"
- cmake --build . --config Release
- 安装 Python 包(若项目提供):
- pip install -r requirements.txt 或 pip install .
- 验证安装:
- python -c "import torch; print('PyTorch:', torch.__version__, 'CUDA available:', torch.cuda.is_available())"
- ffmpeg -version
- 可选:将项目 bin 或 Scripts 目录加入 PATH,便于全局调用。
三 GPU 加速与常见问题处理
- 安装匹配版本的 PyTorch(示例为 CUDA 11.8,按需替换版本):
- pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
- 安装与 CUDA 匹配的 cuDNN,并将其 bin 目录加入 PATH;确保 CUDA_PATH 或 CUDA_HOME 指向正确的 CUDA 安装路径。
- 验证 GPU:
- python - <<'PY'
import torch
print("Torch:", torch.__version__, "CUDA:", torch.version.cuda)
print("CUDA available:", torch.cuda.is_available())
print("Device:", torch.cuda.get_device_name(0) if torch.cuda.is_available() else "None")
PY
- 常见报错速解:
- “Microsoft Visual C++ 14.0 is required” → 安装/修复 Visual Studio Build Tools 的 C++ 桌面开发。
- “No module named 'cv2'” → pip install -U opencv-python;如使用 GPU 版 OpenCV,确保与 CUDA 版本兼容。
- “ffmpeg not found” → 安装 ffmpeg 并加入 PATH。
- “CUDA out of memory” → 降低 batch size 或 分辨率,关闭占用显存的后台程序。
- “CMake error … Could NOT find Python” → 在 CMake 命令中显式传入 -DPYTHON_EXECUTABLE 指向当前环境的 python.exe。
四 性能优化与最小验证
- 性能优化要点:
- 构建时始终使用 Release 模式;确保 GPU 驱动、CUDA、cuDNN 与 PyTorch 版本匹配。
- 使用 SSD 存放数据与权重;合理设置 num_workers 与 pin_memory(DataLoader)。
- 若项目支持 FP16/AMP,在推理阶段开启以节省显存并提升吞吐。
- 最小验证示例(以官方 Demo 脚本为准):
- 准备一段音频与参考视频/图片(按项目 README 的数据格式与命名规范)。
- 运行推理脚本(示例命令,实际以项目脚本名为准):
- python demo.py --audio path/to/audio.wav --ref path/to/ref.mp4 --out out.mp4
- 检查输出视频 out.mp4 的唇形同步与清晰度,确认 ffmpeg 已正确合成音视频。