面向产品落地的高质量生成工作流
一 明确质量目标与评估标准
- 清晰度与细节:主体边缘干净、纹理丰富、无涂抹感;放大后细节不“糊”。
- 结构正确与一致性:人像五官、手部结构合理;产品外观、比例、接口位置符合设计稿。
- 风格与品牌一致性:与品牌色、材质、光影语言一致,可用于展板、海报、电商主图。
- 可控性与可复现:构图、元素位置、配色可稳定复现,便于评审与迭代。
二 提示词与负面词的工程化写法
- 结构化提示词:采用“主体 + 细节 + 风格 + 质量”四段式,重要描述词前置;必要时用括号提升权重,如“(sharp focus:1.2)”。
示例:
- 正向:”product render of electric kettle, brushed stainless steel, matte black handle, clean lines, soft daylight, studio lighting, highly detailed, sharp focus, 8k, product photography“
- 负向:”blurry, lowres, bad anatomy, bad hands, text, watermark, jpeg artifacts, oversaturated, cluttered composition“
- 负面词要“少而准”:针对当前问题添加,如模糊、畸形、低清、水印、文字溢出等,避免无意义的海量堆叠。
- 关键词顺序影响结果:把决定画面走向的核心词放在前面,风格与质量词置后,有助于稳定输出。
三 参数与采样器的稳定配置
- 分辨率:起步用512×512 或 768×768,按需求渐进放大;尽量使用2 的倍数尺寸,利于显存与算法稳定。
- 采样步数:常用30–50 步平衡质量与速度;追求极致细节可上探至50–80 步(成本上升)。
- 引导强度:常用7–9;需要更强控制可到7–12,但可能牺牲多样性。
- 采样器:通用创作可选Euler a;追求稳定可测试DPM++ 2M Karras等。
- 随机种子:固定种子用于评审对比与复现最佳结果。
四 结构控制与一致性提升
- ControlNet 精准控形:
- 产品外观/草图直出渲染:用Canny锁定轮廓、Depth保持前后层次,必要时叠加参考图;权重建议 Canny≈1.0、Depth≈0.7–0.9。
- 人物/手势稳定性:用OpenPose骨架约束姿势,减少手指、肢体崩坏。
- 品牌符号/文字:用Canny+Depth双控,确保字形与版式不被改写。
- 多模型与风格 LoRA:按品类挑选擅长模型(如写实、产品、动漫),配合风格 LoRA 快速贴近品牌语言。
- 工业/电商场景:从草图→渲染、模型三视图→上色、展板背景合成,形成端到端可控链路。
五 后处理与放大策略
- 处理顺序:遵循“先修复后放大”,避免把缺陷一起放大;典型链路:基础修复 → 人脸/手部优化 → 分辨率提升 → 细节增强。
- 放大算法选择与组合:
- ESRGAN:速度快,适合动漫/游戏风格,2–4×。
- SwinIR:细节与写实兼顾,2–8×,人像/写实常用。
- LDSR:细节最丰富但慢,4–16×,艺术画作/高质输出。
- 分阶段渐进放大示例:512→1024(SwinIR 2×)→2048(ESRGAN 2×)→4096(LDSR 2×),兼顾速度与质量。
- 瓦片参数:显存充足(>8GB)建议Tile Size=1024;4–8GB降至512;Tile Overlap=8–16 px减少拼接痕。
- 人脸/手部修复:GFPGAN偏清晰度、CodeFormer偏结构修复;可按人脸置信度混合使用,强度建议0.5–0.9区间微调。
六 产品落地的最小可行流程
- 明确输出规格:尺寸(如2048×2731)、风格(写实/极简)、用途(展板/电商/社媒),并准备参考图与品牌色板。
- 草图/线稿与 ControlNet:导入草图,启用Canny控边、Depth控层;人物/手势加OpenPose;品牌元素用Canny+Depth双控。
- 提示词与负面词:按“主体+细节+风格+质量”编写,负面词聚焦当前问题;固定种子便于复现。
- 参数设定:分辨率起步768×768或512×768;步数30–50;引导7–9;采样器先Euler a或DPM++ 2M Karras。
- 初稿筛选与迭代:批量生成4–8张,选出构图/结构最佳者进入放大流程。
- 放大与修复:按“先修复后放大”执行;人像/手部用GFPGAN/CodeFormer,整体用SwinIR/ESRGAN/LDSR分阶段放大。
- 精修与排版:在PS Beta微调对比度、锐化、污点;统一品牌色与留白,输出sRGB与打印CMYK双版本。
- 归档与复用:沉淀“提示词模板 + ControlNet 预处理器权重 + 放大策略”组合,建立团队可复用资产库。