ComfyUI作为模块化的Stable Diffusion GUI,其显存管理围绕降低峰值占用、提升利用率设计,通过状态配置、量化压缩、分块处理、动态调度四大核心方向优化,支持从入门级(8GB)到高端(24GB+)GPU的高效运行。
ComfyUI通过VRAMState枚举类定义了五种显存管理模式,适配不同显存容量的GPU:
--lowvram启动参数);例如,16GB以上GPU启用--highvram参数,可将UNet等模型常驻GPU,显著提升连续推理效率。
通过降低模型参数精度,在几乎不损失图像质量的前提下减少显存占用:
--fp16-unet参数使UNet以半精度运行,RTX 4090上SDXL模型推理速度提升65%,PSNR值仅下降0.3dB;FP8量化(如--supports-fp8-compute)可进一步减少显存占用,适合4GB以下显存GPU。针对高分辨率图像/视频,将数据分割为小块独立处理,降低单次显存占用:
tiled_sampler.py支持horizontal_tiles(水平分块数)、vertical_tiles(垂直分块数)、overlap(重叠像素)参数,2K视频按2×2分块后,显存需求从8GB降至3.5GB(需额外15%计算时间用于边缘融合)。temporal_tile_size(时间片长度)、temporal_overlap(时间重叠帧数)参数,配合空间分块形成“时空网格”,让RTX 3060等中端显卡可生成10秒以上4K视频。通过智能调度提升多GPU环境下的显存利用率:
--async-offload参数,将闲置模型后台转移至CPU内存;配合LRU缓存策略(--cache-lru 20),缓存最近20个节点计算结果,多工作流切换场景下显存占用降低35%,缓存命中率达90%。model_management": "auto"、vram_management": "lowvram"等参数,支持48GB显存任务的并行处理,提升整体吞吐量。ComfyUI生态中的插件进一步强化了显存管理能力:
LTXVQ8Patch节点)实现FP8注意力机制,显存占用减半,适合4GB以下显存GPU;时空分块技术解决高分辨率视频显存瓶颈。