| 模型 | 条件 |
|---|---|
| 7B 参数模型 | FP16 / INT8 / INT4 均可 |
| 13B 参数模型 | 需 INT4 量化 |
| 小型专用模型 | 如 CodeGen、ChatGLM2-6B、Qwen2.5-7B 等 |
✅ 常见模型示例:
ollama run qwen2.5:7b| 显卡 | 显存 | 适合模型 |
|---|---|---|
| RTX 4070 Ti | 12GB | 7B / 13B INT4 |
| RTX 3090 | 24GB | 13B / 30B |
| RTX 4090 | 24GB | 大模型主力 |
RTX 4070 Ti 适合跑 7B 级别模型,13B 需要量化,不适合 30B+ 大模型。
如果你愿意,可以告诉我:
我可以给你最优配置方案。