总体判断
在入门级本地部署中,使用已有的 RTX 1660 Ti(6GB) 能显著降低“按张付费”的云端推理成本,适合练手与低频出图;但在 768×768 及以上分辨率或批量作业时容易触发 显存不足(OOM),需要降分辨率、分批或改用 CPU,整体效率偏低。社区实测显示,1660 Ti 在 512×512 下约 12.8s/张,而 3060 12GB 约 6.5s/张;在 768×768 的规范测试中,1660 Ti 因 6GB 显存直接爆显存,效率明显下滑。因此,它“能降本”,但并非长期高性价比的主力方案。
成本影响一览
| 场景 | 出图效率(参考) | 显存与可行性 | 对成本的影响 |
|---|---|---|---|
| 512×512 本地 | 约 12.8s/张(≈4.7 it/s) | 6GB 可跑 | 设备已购:单位张成本≈电费+折旧;替代云端按张计费,显著降本 |
| 768×768 本地 | 规范测试中出现 OOM | 6GB 不足,需降分辨率/分批/改 CPU | 效率下降,时间成本上升,综合成本优势减弱 |
| 1024×1024 本地 | 推荐至少 12GB 显存 | 6GB 不推荐 | 难以稳定运行,易失败重试,综合成本反而上升 |
| 云端按张计费 | 速度更快但按张付费 | 不受本地显存限制 | 入门省设备投入;长期高频出图时,单张成本通常高于自建高效本地 |
注:效率与显存结论来自多组实测与配置建议,具体数值会随驱动、采样器、步数等变化。
适用与不适用场景
进一步降本的做法