Windows 部署 GeneFace++ 步骤
一 环境准备
- 安装 Anaconda/Miniconda(Python 3.9),创建并激活环境:conda create -n geneface python=3.9 && conda activate geneface。
- 安装 Visual Studio Build Tools(勾选“C++ 生成工具”)与 CMake,用于编译项目中的 C++/CUDA 扩展。
- 安装 CUDA Toolkit 11.7 与匹配版本的 cuDNN,并确保显卡驱动正常;如需 GPU 加速,后续 PyTorch 需与之匹配。
- 安装 FFmpeg(含 libx264 编码器):conda install -c conda-forge ffmpeg。
- 可选:安装 Git 以便克隆仓库与管理子模块。
二 获取代码与安装依赖
- 克隆仓库:git clone https://github.com/yerfor/GeneFacePlusPlus.git && cd GeneFacePlusPlus。
- 安装 Python 依赖:pip install -r docs/prepare_env/requirements.txt -v。
- 安装核心深度学习库(建议与 CUDA 11.7 配套):conda install pytorch==2.0.1 torchvision==0.15.2 torchaudio==2.0.2 pytorch-cuda=11.7 -c pytorch -c nvidia。
- 安装 PyTorch3D(Windows 推荐预编译或源码方式):pip install "git+https://github.com/facebookresearch/pytorch3d.git@stable"。
- 安装 MMCV:pip install cython && pip install openmim==0.3.9 && mim install mmcv==2.1.0。
- 安装音频依赖:conda/pip 安装 libasound2-dev、portaudio19-dev(Windows 可用对应的 wheel 或 conda-forge 包)。
三 编译与验证
- 编译自定义 CUDA/扩展:在项目根目录执行 bash docs/prepare_env/install_ext.sh;Windows 下请在已配置好 MSVC 与 CUDA 的终端(如 x64 Native Tools Command Prompt)中运行该脚本,或按项目说明使用 CMake 生成 VS 工程后编译。
- 环境验证:
- 检查 PyTorch 与 CUDA:python -c "import torch; print(torch.__version__, torch.cuda.is_available())"。
- 运行 3D 重建模块测试(示例路径,按项目结构调整):CUDA_VISIBLE_DEVICES=0 python deep_3drecon/test.py;若无报错,基本说明环境可用。
四 数据准备与训练推理
- 训练数据规范:准备一段 3–5 分钟、画面清晰、最好是 512×512、背景简洁、人物正面、音频干净的视频,文件名用英文。
- 数据预处理:按项目脚本将视频裁剪为 512×512、25 FPS,并进行人脸跟踪/对齐等预处理(参考仓库脚本与文档)。
- 训练与生成:运行官方提供的训练与推理脚本或 WebUI 入口,按界面选择训练步数与模型权重(如音频驱动模型与头部/躯干模型)进行生成。训练时长与显存相关,建议使用 NVIDIA GPU 并确保磁盘空间充足。
五 常见问题与排错要点
- 版本不匹配:确保 Python 3.9、PyTorch 2.0.1 + cu117、MMCV 2.1、PyTorch3D 版本相互兼容;出现 “CUDA/ATen/cuDNN” 错误时优先核对 CUDA 与驱动版本。
- 编译失败:确认已安装 VS Build Tools、CUDA 11.7 工具链,并在正确的 VS 命令行环境下执行 install_ext.sh;必要时改用预编译包或更新显卡驱动。
- 依赖缺失:若提示缺少 ffmpeg/portaudio 等,按上文补充安装对应库。
- 资源不足:训练阶段对 显存/内存/磁盘 要求较高,可先用较小步数验证流程,再扩大训练规模。