在Linux上运行Llama3模型可以通过Ollama工具来实现,以下是详细的步骤:
curl -fsSL https://ollama.com/install.sh | sh
或者,您可以先下载脚本查看内容,确认无误后再执行:
curl -fsSL https://ollama.com/install.sh -o install_ollama.sh
cat install_ollama.sh
bash install_ollama.sh
ollama -v
docker run -d -v $PWD/ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
ollama serve
docker exec -it ollama /bin/bash
ollama run llama3:8b
这里的llama3:8b
指的是Llama3的80亿参数版本。您也可以使用ollama run llama3
来运行默认的8B模型。
docker run -d --network=host -v open-webui:/app/backend/data -e OLLAMA_BASE_URL=http://127.0.0.1:11434 --name open-webui --restart always ghcr.io/open-webui/open-webui:main
如果镜像拉取速度慢,可以使用国内的镜像源:
docker run -d --network=host -v open-webui:/app/backend/data -e OLLAMA_BASE_URL=http://127.0.0.1:11434 --name open-webui --restart always registry.cn-hangzhou.aliyuncs.com/pzl_images/open-webui:main
部署完成后,访问http://服务器IP:8080
注册管理员账号,并使用管理员账号登录。
通过以上步骤,您就可以在Linux上成功部署Llama3模型,并通过Ollama和Open-WebUI进行模型管理和使用。