极客前沿

Ollama 入门:本地运行 AI 模型,一步步装好就能用

2026-05-10 01:34
DEV Ollama
查看原文

本文教你安装 Ollama,下载并运行本地 AI 模型,第一次调用 API,零基础也能上手。

什么是 Ollama?为什么要用它?

Ollama 是一个免费工具,让你能在自己的电脑上运行AI 语言模型(一种能理解并生成文字的程序,比如 ChatGPT 背后的技术)。相比使用云端服务,本地运行的好处是数据不用上传,隐私更好,而且不用网络也能用。适合新手入门和实验。

安装 Ollama

Ollama 支持 Windows、macOS 和 Linux。以下是安装步骤:

  1. 打开浏览器,访问 ollama.com,点击“Download”。
  2. 根据你的系统下载对应版本:Windows 选 .exe,macOS 选 .dmg,Linux 选脚本。
  3. 双击安装文件,按提示完成安装(Windows 可能需要管理员权限)。
  4. 安装完成后,打开终端(Windows 用命令提示符或 PowerShell,mac/Linux 用终端)。
  5. 输入 ollama --version,如果显示版本号,说明安装成功。

常见坑:Windows 用户如果遇到“不是内部或外部命令”,请检查是否以管理员身份运行终端,或者重启电脑。

下载并运行第一个模型

Ollama 提供了很多现成的模型,我们先用一个小模型试试:

Tutorial Image
  1. 在终端中运行:ollama run llama3.2:1b(这是 Meta 的轻量模型,适合新手)。
  2. 等待下载完成(第一次会下载几百 MB 到 1GB 左右,请确保网络稳定)。
  3. 下载完成后,你会看到 >>> 提示符,直接输入问题,比如“你好,你是谁?”,模型就会回答。
  4. 输入 /exit 退出对话。

解释模型就是 AI 的“大脑”,不同模型有不同大小和能力。1B 表示 10 亿参数,参数越多通常越聪明,但需要更多内存。

通过 API 调用模型(进阶用法)

Ollama 还提供了一个API(应用程序接口,让其他程序能调用模型),方便你从脚本或应用中使用模型。

  • 确保 Ollama 在后台运行(启动终端后运行 ollama serve)。
  • 打开另一个终端,用 curl 测试:curl http://localhost:11434/api/generate -d '{"model": "llama3.2:1b", "prompt": "你好"}'
  • 你会看到模型返回的 JSON 格式回答。

常见坑:如果 API 连接不上,检查是否运行了 ollama serve,或者防火墙阻止了 11434 端口。

下一步可以做什么?

  • 尝试其他模型:ollama run llama3.2:3bollama run mistral(更大更强)。
  • 用 Python 调用 API:安装 requests 库,发送 POST 请求即可。
  • 探索 Ollama 官网的模型库,找到适合你任务的模型。

内容来源

DEV Ollama

发布时间

2026-05-10 01:34

返回 AI技术