Ollama 入门：本地运行 AI 模型，一步步装好就能用

本文教你安装 Ollama，下载并运行本地 AI 模型，第一次调用 API，零基础也能上手。

什么是 Ollama？为什么要用它？

Ollama 是一个免费工具，让你能在自己的电脑上运行AI 语言模型（一种能理解并生成文字的程序，比如 ChatGPT 背后的技术）。相比使用云端服务，本地运行的好处是数据不用上传，隐私更好，而且不用网络也能用。适合新手入门和实验。

Ollama 支持 Windows、macOS 和 Linux。以下是安装步骤：

常见坑：Windows 用户如果遇到“不是内部或外部命令”，请检查是否以管理员身份运行终端，或者重启电脑。

Ollama 提供了很多现成的模型，我们先用一个小模型试试：

解释：模型就是 AI 的“大脑”，不同模型有不同大小和能力。1B 表示 10 亿参数，参数越多通常越聪明，但需要更多内存。

Ollama 还提供了一个API（应用程序接口，让其他程序能调用模型），方便你从脚本或应用中使用模型。

确保 Ollama 在后台运行（启动终端后运行 ollama serve）。
打开另一个终端，用 curl 测试：curl http://localhost:11434/api/generate -d '{"model": "llama3.2:1b", "prompt": "你好"}'。
你会看到模型返回的 JSON 格式回答。

常见坑：如果 API 连接不上，检查是否运行了 ollama serve，或者防火墙阻止了 11434 端口。

内容来源

DEV Ollama

发布时间

2026-05-10 01:34