Ollama 入门:本地运行 AI 模型,一步步装好就能用
本文教你安装 Ollama,下载并运行本地 AI 模型,第一次调用 API,零基础也能上手。
什么是 Ollama?为什么要用它?
Ollama 是一个免费工具,让你能在自己的电脑上运行AI 语言模型(一种能理解并生成文字的程序,比如 ChatGPT 背后的技术)。相比使用云端服务,本地运行的好处是数据不用上传,隐私更好,而且不用网络也能用。适合新手入门和实验。
安装 Ollama
Ollama 支持 Windows、macOS 和 Linux。以下是安装步骤:
- 打开浏览器,访问 ollama.com,点击“Download”。
- 根据你的系统下载对应版本:Windows 选 .exe,macOS 选 .dmg,Linux 选脚本。
- 双击安装文件,按提示完成安装(Windows 可能需要管理员权限)。
- 安装完成后,打开终端(Windows 用命令提示符或 PowerShell,mac/Linux 用终端)。
- 输入
ollama --version,如果显示版本号,说明安装成功。
常见坑:Windows 用户如果遇到“不是内部或外部命令”,请检查是否以管理员身份运行终端,或者重启电脑。
下载并运行第一个模型
Ollama 提供了很多现成的模型,我们先用一个小模型试试:
- 在终端中运行:
ollama run llama3.2:1b(这是 Meta 的轻量模型,适合新手)。 - 等待下载完成(第一次会下载几百 MB 到 1GB 左右,请确保网络稳定)。
- 下载完成后,你会看到
>>>提示符,直接输入问题,比如“你好,你是谁?”,模型就会回答。 - 输入
/exit退出对话。
解释:模型就是 AI 的“大脑”,不同模型有不同大小和能力。1B 表示 10 亿参数,参数越多通常越聪明,但需要更多内存。
通过 API 调用模型(进阶用法)
Ollama 还提供了一个API(应用程序接口,让其他程序能调用模型),方便你从脚本或应用中使用模型。
- 确保 Ollama 在后台运行(启动终端后运行
ollama serve)。 - 打开另一个终端,用 curl 测试:
curl http://localhost:11434/api/generate -d '{"model": "llama3.2:1b", "prompt": "你好"}'。 - 你会看到模型返回的 JSON 格式回答。
常见坑:如果 API 连接不上,检查是否运行了 ollama serve,或者防火墙阻止了 11434 端口。
下一步可以做什么?
- 尝试其他模型:
ollama run llama3.2:3b或ollama run mistral(更大更强)。 - 用 Python 调用 API:安装
requests库,发送 POST 请求即可。 - 探索 Ollama 官网的模型库,找到适合你任务的模型。
内容来源
DEV Ollama
发布时间
2026-05-10 01:34