部署DeepSeek R1到Windows系统可以通过两种主要方案实现:硅基流动API调用和Ollama本地部署。以下是详细的步骤和技巧:
硅基流动API调用
适合人群:普通用户、小白、不想折腾硬件的用户。
优势:无需本地算力,手机号注册即用,响应速度稳定,支持手机端。
步骤详解:
- 注册硅基流动账号并实名认证,新用户可获得2000万Token额度(约14元)。
- 获取API密钥,登录后点击左侧菜单栏「账户管理」→「API密钥」,点击「新建密钥」并填写描述,复制生成的密钥串备用。
- 配置ChatBox客户端下载并安装ChatBox(支持Win/Mac/iOS/安卓),在「设置」中填入关键信息:模型提供方选择SiliconFlow API,模型名称选择deepseek-ai/DeepSeek-R1,API密钥粘贴刚才复制的密钥。
- 输入问题测试,若成功回答问题,说明配置成功。
Ollama本地部署
适合人群:追求隐私安全、想离线使用的用户。
硬件要求:
- 1.5B版本:非必需(纯CPU推理),若GPU加速可选4GB+显存(如GTX 1650)。
- 7B版本:推荐8GB+显存(如RTX 3070/4060)。
- 8B版本:与7B相近。
- 14B版本:16GB+显存(如RTX 4090或A5000)。
- 32B版本:24GB+显存(如A100 40GB或双卡RTX 3090)。
- 70B版本:多卡并行(如2x A100 80GB或4x RTX 4090)。
操作步骤:
- 安装Ollama软件,访问官网[https://ollama.com/]下载对应系统版本(Windows需管理员权限安装),安装完成后按Win+R键,输入cmd打开命令提示符。
- 输入
ollama
,当弹出信息说明安装成功。 - 下载大模型,访问链接[https://ollama.com/library/deepseek-r1],选择需要的模型版本后,复制命令并在命令提示符中粘贴执行。
- 下载完成后,打开ChatBox,在「设置」中「模型提供方」选择「Ollama API」,API域名自动填写,模型选择刚才下载好的DeepSeekR1模型。
- 输入问题测试,若成功回答问题,说明配置成功。
优化对话界面的技巧
- 安装Chatbox Ai,选择网页版或下载到本地。
- 点击settings进入设置页面,调成中文模式。
- 选择Display进行语言设置,点击Language再选择简体中文,点击Save保存。
- 进行模型的导入,在「设置」中「模型」里选择Ollama的API,模型选择刚刚下载的模型,点击保存。
- 按Win+X,点击“系统”,点击“高级系统设置”。
- 点击环境变量,在用户变量中新建变量名:OLLAMA_HOST,变量值:0.0.0.0,点击确定。
- 再新建一个变量名:OLLAMA_ORIGINS,变量值输入:*,最后点击确定。
- 关闭系统命令窗口,关闭OLLAMA的小窗,重新打开OLLAMA。
通过以上步骤和技巧,你可以成功将DeepSeek R1部署到Windows系统,并根据需要选择合适的方案进行优化。