优化Linux上的Stable Diffusion性能可从硬件、软件配置及运行参数三方面入手,具体如下:
xFormers
加速注意力机制计算,通过pip install xformers
配置。CUDA_VISIBLE_DEVICES
环境变量指定多卡并行计算,或使用torch.nn.DataParallel
实现数据并行。nvidia-smi
监控GPU使用情况,确保驱动版本与CUDA兼容。pipe.enable_attention_slicing(slice_size="auto")
,减少显存峰值占用。pipe.enable_sequential_cpu_offload()
卸载至CPU。--medvram
或--lowvram
模式(需配合opt-channelslast
),适配低显存设备。参考来源: