RX 9070 本地聊天机器人使用指南
方式一 AMD Chat 内置在 Adrenalin(推荐)
- 适用与准备
- 仅支持 AMD Radeon RX 9070 / RX 9070 XT,需 Windows 并安装 AMD Software: Adrenalin Edition 25.3.1 或更新版本。该组件为可选升级,首次下载体量较大(约需预留 25GB+ 磁盘空间)。更新或安装时建议通过 AMD Install Manager 完成。
- 启用步骤
- 打开 AMD Software: Adrenalin Edition,进入 系统 选项卡,点击 管理更新,在 AMD Install Manager 中找到并安装 AMD Chat 组件(安装完成后可能需要重启)。
- 安装完成后,在 Adrenalin 界面中进入 AMD Chat,按提示开始本地对话。
- 功能要点:支持 文本与图像生成,可回答 AMD 硬件相关问题,并能触发/启用 Adrenalin 中的部分关键功能;对话与生成在本地完成,不上传云端。
方式二 使用 LM Studio 在 RX 9070 上运行开源模型
- 适用与准备
- 适合想灵活选择模型与参数的用户。RX 9070 系列建议使用 LM Studio 的 ROCm 技术预览版(Windows),可在本地加载 GGUF 模型进行 GPU 加速推理。
- 操作步骤
- 安装 LM Studio(Windows,ROCm 技术预览)。
- 在 Search 页搜索并下载模型(示例关键词):
- TheBloke/OpenHermes-2.5-Mistral-7B-GGUF(Mistral 7B)
- TheBloke/Llama-2-7B-Chat-GGUF(Llama 2 7B)
建议优先选择 Q4 K M 量化版本,在显存与速度间更均衡。
- 切到 Chat 页,选择已下载的模型加载。
- 在右侧面板开启 GPU Offload 并将滑块拉到 Max,确认检测到 AMD ROCm 作为 GPU 类型,开始对话。
- 提示:模型加载的 Context Length 越大越吃显存;简单问答可用 4096,长文/写作可适当增大(受限于显存)。
常见问题与优化
- 兼容性与性能
- AMD Chat 为 RX 9070 系列独占;若未看到该组件,请确认 Adrenalin 25.3.1+ 并通过 AMD Install Manager 安装。
- LM Studio ROCm 预览版在 RX 9070 上可获得 GPU 加速;若出现加载慢或显存不足,可改用更小的模型或降低 Context Length。
- 体验建议
- 首次使用 AMD Chat 需下载约 25GB+ 数据;确保磁盘空间充足与网络稳定。
- 使用 LM Studio 时,优先选择 Q4 K M 量化模型;需要更快响应可减少上下文或关闭部分后台程序以释放显存。