1. 硬件配置优化
2. 显存管理优化
--lowvram),强制模型使用更少显存;或使用“低显存模型”(如Stable Diffusion 1.5 pruned版),减少显存占用。3. 软件与依赖优化
torch==2.2.0+cu121),并通过torch.cuda.set_per_process_memory_fraction限制单进程显存使用,避免显存溢出。4. 工作流设计优化
5. 容器化部署优化(可选)
yanwk/comfyui-boot:cu124-slim等最小化镜像,减少容器启动时间和资源占用。/root/.cache)映射到宿主机卷,避免容器重启后模型丢失;通过NVIDIA_VISIBLE_DEVICES指定使用的GPU(如0,1表示使用第0、1张GPU),优化多GPU资源分配。