AI 入门:从零搭建本地 LLM 服务
学会安装 Ollama 和 Open WebUI,在本地跑通第一个大模型,并分享给队友使用。
准备环境
你需要一台能联网的电脑(Windows / macOS / Linux 皆可),并安装 Docker Desktop(一个帮你运行容器化应用的工具)。从官网下载安装后,打开 Docker 并确保它正常运行。
安装步骤
- 安装 Ollama:Ollama 是一个让你在本地运行大模型(如 Llama、Mistral)的工具。去 ollama.com 下载并安装。安装后打开终端(命令提示符),输入
ollama run llama3.2,等待下载完成即可对话。这是你的第一个本地模型! - 安装 Open WebUI:这是一个图形界面,让你像用 ChatGPT 一样用本地模型。打开终端,运行:
docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway --name open-webui --restart always ghcr.io/open-webui/open-webui:main。耐心等待下载。 - 配置 Open WebUI 连接 Ollama:在终端运行
docker logs open-webui查看日志,确认无报错。然后打开浏览器,访问http://localhost:3000,注册第一个账号(管理员)。进入设置,确保 OLLAMA_BASE_URL 指向http://host.docker.internal:11434(Mac 用户)或http://localhost:11434(Linux/Windows 用户)。
验证是否成功
在 Open WebUI 的聊天框里输入问题,比如“写一首关于春天的诗”。如果模型回复了,恭喜你!你已经成功跑通了本地 LLM。你可以在管理面板里禁用公开注册,手动添加团队成员账号,并控制每个人能用的模型(比如给新手用 7B 小模型,给高级用户用 70B 大模型)。
下一步可以做什么
- 让模型联网:在 Open WebUI 设置中开启“网络搜索”功能,模型就能获取实时信息。
- 暴露给团队:如果你想让局域网内其他人访问,需要修改 Ollama 的环境变量
OLLAMA_HOST=0.0.0.0(Mac 用户在~/.zshrc中添加,Windows 用户在系统环境变量中添加)。注意:千万不要直接暴露到公网,否则别人可能偷用你的 GPU!建议用反向代理加密码保护。 - 使用 OpenAI 兼容接口:你的本地模型提供了与 OpenAI 兼容的 API 地址
http://localhost:11434/v1/,可以配合 LangChain、Cursor 等工具使用。
内容来源
DEV Ollama
发布时间
2026-05-25 01:32