极客前沿

5分钟上手:在本地跑通你的第一个AI模型

2026-05-27 01:32
DEV Ollama
查看原文

零基础也能学会!本文教你下载安装Ollama,并在自己电脑上运行第一个本地大语言模型。

什么是本地AI?为什么值得一试?

大语言模型(LLM)就是ChatGPT、Claude背后的“大脑”。本地AI把这个大脑装到你自己的电脑上运行,而不是依赖别人的服务器。打个比方:云端AI像租车,本地AI像骑自行车——慢一点,但免费、私有、没人能拿走。

第一步:安装Ollama——AI模型的“应用商店”

Ollama是运行本地LLM最简单的工具,你可以把它想象成AI模型的“App Store”。

  1. 打开浏览器,访问 ollama.com/download
  2. 根据你的操作系统(Windows/Mac/Linux)下载对应安装包。
  3. 双击运行安装程序,按提示完成安装。

🔥 小提示:如果在Linux或macOS终端里输入命令后提示“command not found”,请重启终端,或者运行 export PATH=$PATH:/usr/local/bin 再试。

第二步:下载并运行你的第一个AI模型

安装好Ollama后,打开终端(Windows用户打开PowerShell或CMD),输入以下命令并回车:

ollama run qwen2.5:7b

Tutorial Image

这个命令会下载一个约4.7GB的模型,根据网速不同需要2-5分钟。下载完成后,模型会自动启动,你会看到一个提示符,表示AI已经准备好回答你的问题。

如果4.7GB太大,可以试试更小的模型,比如 ollama run phiollama run tinyllama

第三步:和你的本地AI聊聊天

在终端里直接输入问题,比如“你好,请介绍一下你自己”,模型会思考片刻然后回答你。恭喜!你已经成功在自己的硬件上运行了AI!🎉

⚠️ 注意:本地模型比ChatGPT慢是正常的。有GPU时速度约15-40个token/秒,仅用CPU时约2-6个token/秒,但仍然比大多数人阅读速度快。

下一步可以做什么?

  • 试试其他模型:访问ollama.com/library浏览更多选择。
  • 用Ollama配合编程工具(如Python的langchain)开发自己的AI应用。
  • 调整模型参数(如温度)改变回答的随机性。

第一次跑通就像学骑自行车,摇摇晃晃但一旦学会,你会后悔没有早点开始。

内容来源

DEV Ollama

发布时间

2026-05-27 01:32

返回 AI技术