OpenELM 是 Apple 开源的一系列高效小参数量 LLM,常见版本:
特点:
核心:提前下载模型 → 本地加载 → 断网运行
流程如下:
联网环境
↓
下载 OpenELM 模型 & 依赖
↓
拷贝到离线机器
↓
本地加载模型(不访问网络)
↓
离线推理 / 应用pip install torch transformers acceleratefrom transformers import AutoModelForCausalLM, AutoTokenizer
model_id = "apple/OpenELM-1_1B-Instruct"
tokenizer = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(
model_id,
torch_dtype="auto",
device_map="auto"
)
# 保存到本地
tokenizer.save_pretrained("./openelm-1.1b")
model.save_pretrained("./openelm-1.1b")✅ 完成后会生成:
openelm-1.1b/
├── config.json
├── model.safetensors
├── tokenizer.json
└── ...使用 U 盘 / 内网 / 压缩包:
scp -r openelm-1.1b user@offline-machine:/models/⚠️ 必须 local_files_only=True
from transformers import AutoModelForCausalLM, AutoTokenizer
model_path = "/models/openelm-1.1b"
tokenizer = AutoTokenizer.from_pretrained(
model_path,
local_files_only=True
)
model = AutoModelForCausalLM.from_pretrained(
model_path,
local_files_only=True,
torch_dtype="auto",
device_map="auto"
)
inputs = tokenizer("请介绍一下自己", return_tensors="pt")
outputs = model.generate(**inputs, max_new_tokens=100)
print(tokenizer.decode(outputs[0]))git lfs(适合批量模型)git lfs install
git clone https://huggingface.co/apple/OpenELM-1_1B-Instructfrom transformers import AutoModelForCausalLM, AutoTokenizer
model = AutoModelForCausalLM.from_pretrained(
"./OpenELM-1_1B-Instruct",
local_files_only=True
)✅ 推荐配置:
import torch
torch.device("mps")示例:
model = model.to("mps")✅ 解决:
local_files_only=True✅ 解决:
✅ 可选方案:
如果你需要:
可以告诉我你的 系统 + 使用场景,我可以给你定制方案。