提示词是与Stable Diffusion沟通的“桥梁”,其质量直接决定生成图像是否符合创意预期。提示词的结构与细节设计是关键:
best quality、ultra-detailed、8k resolution)提升画面精度;主体描述(如a girl in cherry blossom forest、glowing books floating among trees)需用逗号分隔具体元素(颜色、材质、动作等),动态描述(如dancing in the rain、water droplets splashing)可增强画面生动性;风格/艺术家(如Studio Ghibli style、by Hayao Miyazaki、oil painting texture)快速定义视觉基调。例如:“(best illustration), glowing books floating among ancient trees, bioluminescent mushrooms illuminating the path, Studio Ghibli meets James Jean style, fantasy color palette”。()调整元素权重(如(sunflowers:1.5)强调向日葵的突出),中括号[]弱化不需要的部分(如[blurry background]虚化背景);负面提示词(如low quality、deformed hands、extra fingers、watermark)排除干扰元素,需尽量具体(如避免“bad anatomy”改为“extra limbs”)。参数设置直接影响生成效率和效果,需根据创意需求调整:
Euler a多样性高但步数高,适合实验性创作;DPM++ 2S a Karras细节丰富但耗时久,适合高质量作品;UniPC速度快且效果好,推荐用于平面/卡通风格;DDIM收敛快,适合重绘(如inpainting/outpainting)。Sampling Steps)决定降噪程度,一般20-30步即可(边际收益递减),步数过多会浪费资源;CFG Scale(Prompt Relevance)控制提示词相关性,推荐7-11(过高会导致线条粗犷、过锐化,过低则偏离创意)。Hires. fix)。高清修复通过放大算法(如ESRGAN_4x、SwinR 4x)提升分辨率,重绘幅度建议0.5以下(避免过度变形)。Stable Diffusion的灵活性允许融合多种风格,突破传统创作限制:
Anime模型(如Anything V5)专注二次元,现实风格模型(如Realistic Vision)生成照片级人像/风景,抽象风格模型(如Abstract Fantasy)适合超现实创作。模型选择需贴合创意主题(如科幻题材选Cyberpunk Diffusion,古风选Chinese Ink Painting)。Stable Diffusion的高级功能可实现更精细的创意控制:
Stable Diffusion的创意表达可落地于多个领域: