5分钟上手:在本地跑通你的第一个AI模型
零基础也能学会!本文教你下载安装Ollama,并在自己电脑上运行第一个本地大语言模型。
什么是本地AI?为什么值得一试?
大语言模型(LLM)就是ChatGPT、Claude背后的“大脑”。本地AI把这个大脑装到你自己的电脑上运行,而不是依赖别人的服务器。打个比方:云端AI像租车,本地AI像骑自行车——慢一点,但免费、私有、没人能拿走。
第一步:安装Ollama——AI模型的“应用商店”
Ollama是运行本地LLM最简单的工具,你可以把它想象成AI模型的“App Store”。
- 打开浏览器,访问 ollama.com/download。
- 根据你的操作系统(Windows/Mac/Linux)下载对应安装包。
- 双击运行安装程序,按提示完成安装。
🔥 小提示:如果在Linux或macOS终端里输入命令后提示“command not found”,请重启终端,或者运行 export PATH=$PATH:/usr/local/bin 再试。
第二步:下载并运行你的第一个AI模型
安装好Ollama后,打开终端(Windows用户打开PowerShell或CMD),输入以下命令并回车:
ollama run qwen2.5:7b
这个命令会下载一个约4.7GB的模型,根据网速不同需要2-5分钟。下载完成后,模型会自动启动,你会看到一个提示符,表示AI已经准备好回答你的问题。
如果4.7GB太大,可以试试更小的模型,比如 ollama run phi 或 ollama run tinyllama。
第三步:和你的本地AI聊聊天
在终端里直接输入问题,比如“你好,请介绍一下你自己”,模型会思考片刻然后回答你。恭喜!你已经成功在自己的硬件上运行了AI!🎉
⚠️ 注意:本地模型比ChatGPT慢是正常的。有GPU时速度约15-40个token/秒,仅用CPU时约2-6个token/秒,但仍然比大多数人阅读速度快。
下一步可以做什么?
- 试试其他模型:访问ollama.com/library浏览更多选择。
- 用Ollama配合编程工具(如Python的langchain)开发自己的AI应用。
- 调整模型参数(如温度)改变回答的随机性。
第一次跑通就像学骑自行车,摇摇晃晃但一旦学会,你会后悔没有早点开始。
内容来源
DEV Ollama
发布时间
2026-05-27 01:32