AI 入门:手把手装好本地大模型,第一次跑通
零基础学会安装 Ollama、下载模型、运行你的第一个本地 AI,告别云端 API,免费且私密。
很多人想用 AI,但被云端 API 的付费和隐私问题劝退。其实你完全可以免费在自己电脑上跑模型,而且步骤很简单。这篇文章带你一步步装好环境,并跑通第一个对话。
1. 准备环境:你只需要一台电脑
- 硬件:8GB 以上内存的电脑即可,有 NVIDIA 显卡(如 RTX 3060)效果更好,但不是必须。CPU 也能跑,只是慢一些。
- 操作系统:Windows、macOS、Linux 都支持。本文以 Windows 为例。
- 下载 Ollama:Ollama 是一个让你轻松运行本地模型的工具。去 ollama.com 点击 Download,选择对应系统版本安装。安装后打开终端(CMD 或 PowerShell)输入
ollama --version,看到版本号即成功。
2. 安装步骤:下载并运行你的第一个模型
- 打开终端(Windows 按 Win+R,输入 cmd 回车)。
- 输入
ollama pull qwen3.5:9b并回车。这会下载一个 9B 参数的模型(约 5GB)。模型就是 AI 的大脑,参数越多越聪明,但需要更多内存。 - 等待下载完成(进度条走完)。如果网速慢,可以换用更小的模型,如
qwen3.5:4b(约 2.5GB)。 - 下载完成后,输入
ollama run qwen3.5:9b并回车。你会看到一个>>>提示符,表示模型已启动。 - 试试输入 "你好" 或 "用 Python 写一个斐波那契数列",模型会回复你。恭喜,你已经跑通了本地 AI!
3. 验证是否成功:几个小测试
- 对话测试:在
>>>后输入任意问题,看是否正常回复。 - 退出模型:输入
/bye回车即可退出。 - 查看已下载模型:输入
ollama list能看到所有已安装的模型。 - 常见坑:如果下载很慢,可以尝试切换网络或换用更小的模型。如果运行时报内存不足,关掉其他程序再试。
4. 下一步可以做什么?
- 安装更多模型:去 ollama.com/library 浏览,用
ollama pull 模型名下载。 - 使用图形界面:下载 Open WebUI(一个漂亮的前端),通过 Docker 或直接安装,就能像 ChatGPT 一样在浏览器里用本地模型。
- 集成到代码:Ollama 提供 API,你可以在 Python 等语言中调用它,实现自动化。
现在你已经拥有了一个完全免费、私密的 AI 助手。不用再担心 token 费用和数据泄露,尽情探索吧!
内容来源
DEV Ollama
发布时间
2026-05-16 01:32