5分钟上手：在本地跑通你的第一个AI模型

零基础也能学会！本文教你下载安装Ollama，并在自己电脑上运行第一个本地大语言模型。

什么是本地AI？为什么值得一试？

大语言模型（LLM）就是ChatGPT、Claude背后的“大脑”。本地AI把这个大脑装到你自己的电脑上运行，而不是依赖别人的服务器。打个比方：云端AI像租车，本地AI像骑自行车——慢一点，但免费、私有、没人能拿走。

Ollama是运行本地LLM最简单的工具，你可以把它想象成AI模型的“App Store”。

🔥 小提示：如果在Linux或macOS终端里输入命令后提示“command not found”，请重启终端，或者运行 export PATH=$PATH:/usr/local/bin 再试。

安装好Ollama后，打开终端（Windows用户打开PowerShell或CMD），输入以下命令并回车：

ollama run qwen2.5:7b

这个命令会下载一个约4.7GB的模型，根据网速不同需要2-5分钟。下载完成后，模型会自动启动，你会看到一个提示符，表示AI已经准备好回答你的问题。

如果4.7GB太大，可以试试更小的模型，比如 ollama run phi 或 ollama run tinyllama。

在终端里直接输入问题，比如“你好，请介绍一下你自己”，模型会思考片刻然后回答你。恭喜！你已经成功在自己的硬件上运行了AI！🎉

⚠️ 注意：本地模型比ChatGPT慢是正常的。有GPU时速度约15-40个token/秒，仅用CPU时约2-6个token/秒，但仍然比大多数人阅读速度快。

第一次跑通就像学骑自行车，摇摇晃晃但一旦学会，你会后悔没有早点开始。

内容来源

DEV Ollama

发布时间

2026-05-27 01:32