Windows 上 GeneFace++ 部署指南
一 环境准备
- 操作系统与权限:建议使用 Windows 10/11 64 位,以管理员权限安装软件与环境变量。硬件建议 CPU ≥ 2 核 2GHz、内存 ≥ 8GB、存储 ≥ 10GB(GPU 训练/推理另行准备)。
- Python 与虚拟环境:安装 Python 3.8/3.9(推荐 Anaconda 管理环境),创建隔离环境:conda create -n geneface_env python=3.8 -y && conda activate geneface_env。
- 编译工具:安装 Visual Studio Build Tools 2019/2022(勾选“C++ 桌面开发”组件),用于编译 C/C++/CUDA 扩展。
- 基础依赖:pip 安装 numpy、opencv-python、torch、torchvision 等;若项目提供 requirements.txt,优先执行 pip install -r requirements.txt。
- GPU 支持(可选但强烈推荐):准备 NVIDIA RTX 显卡,安装与 PyTorch 版本匹配的 CUDA Toolkit 与 cuDNN,并确保显卡驱动为最新稳定版。
二 获取源码与安装依赖
- 获取源码:从项目官方 GitHub 仓库克隆或下载源码(示例:git clone https://github.com/your-repo/GeneFace++.git),进入项目根目录。
- 安装依赖:在激活的虚拟环境中,优先使用项目 requirements.txt 一键安装;如未提供,手动安装常见依赖:pip install numpy opencv-python torch torchvision。
- 版本匹配要点:若需 GPU,安装与 CUDA 版本对应的 PyTorch(如 torch==1.11.0+cu113 对应 CUDA 11.3),避免 CPU/GPU 版本混用导致运行失败。
三 编译与安装
- 含 C/C++/CUDA 扩展时,使用 CMake 构建:在项目根目录执行 mkdir build && cd build,然后 cmake .. 生成 Visual Studio 工程;如需指定生成器与架构,可使用:cmake .. -G "Visual Studio 16 2019" -A x64 -DPYTHON_EXECUTABLE=pathtopython.exe。
- 编译:执行 cmake --build . --config Release(Release 模式性能更佳)。
- Python 包安装:若项目包含 setup.py,编译完成后执行 pip install . 将模块安装到当前环境。
- 可执行文件全局调用(可选):将项目的 bin 或可执行文件目录加入系统 PATH,便于命令行直接调用。
四 快速验证与常见故障
- 快速验证:运行项目提供的 demo/推理脚本 或启动 WebUI(若项目自带),检查是否能正常加载模型与处理示例音频/视频;GPU 环境下确认 torch.cuda.is_available() 为 True。
- 常见故障排查:
- 编译报错“缺少头文件/链接库”:确认 Visual Studio Build Tools 与 CUDA 安装完整,CMake 生成器与 Python 架构(x64)一致。
- 导入/运行报错“DLL load failed”或找不到模块:多为 CUDA/ cuDNN 与 PyTorch 版本不匹配,或依赖未装全;按项目要求重装对应版本。
- GPU 不可用:检查 显卡驱动、CUDA/cuDNN 与 PyTorch 三者版本匹配,并确认运行设备为 cuda。
- 权限/路径问题:以管理员权限运行命令行,避免中文或空格路径,必要时将可执行目录加入 PATH。
五 训练与推理简要流程
- 数据准备:按项目说明准备训练视频(建议短时长、光照均匀、正面清晰)。
- 训练启动:在 WebUI 中导入视频并设置训练步数(如 50000 步),点击 Train 开始;训练通常需数小时,期间可检查日志确保未中断。
- 推理生成:训练完成后,在界面选择音频驱动模型与对应步数的躯干/头部模型(如 model_ckpt_steps_400000.ckpt、model_ckpt_steps_50000.ckpt),上传音频并点击 Generate 生成结果。
- 进阶训练:如需提升效果,可删除对应模型的 head_done / torso_done 目录,保持视频文件名不变,提高训练步数(如 150000 步)后重新训练。