本地跑AI模型入门：从安装到第一次跑通

手把手教你安装Ollama，下载并运行开源AI模型，无需高端显卡，零基础也能上手。

想试试AI但又不想每月花几百块买API？其实你手头的电脑就能跑。本教程带你从零开始，在本地安装环境、下载模型，并成功运行一个类似ChatGPT的AI助手。全程免费，只需跟着步骤走。

准备环境：你需要什么？

跑AI模型最关键的硬件是显卡的显存（VRAM，即显卡专用内存）。好消息是：5年前的RTX 3060就能流畅运行7B参数级别的模型，速度够日常聊天、写代码、分析文档。如果你只有笔记本电脑，推荐先试Qwen 2.5:1.5b或Phi-4 Mini，它们对硬件要求极低。

安装Ollama：AI模型的“应用商店”

Ollama是一个让你轻松下载和运行AI模型的工具，就像手机上的应用商店。去ollama.com/download下载对应你系统的安装包（Windows、macOS、Linux都有），双击安装即可。安装完成后，打开终端（Windows搜索“cmd”或“PowerShell”），输入以下命令测试是否成功：

ollama --version 如果显示版本号，说明安装成功。

下载并运行你的第一个模型

Ollama安装好后，就可以拉取模型了。我们选一个适合新手的中文模型：Qwen 2.5:7b（通义千问系列，中文能力很强）。在终端输入：

ollama pull qwen2.5:7b 等待下载完成（约4GB，网速不同耗时不同）。
ollama run qwen2.5:7b 模型启动后，你就可以在终端里直接跟它对话了。

输入任意问题，比如“你好，请介绍一下你自己”，模型就会回复。按Ctrl+D或输入/bye退出对话。

验证成功：用网页界面聊得更爽

终端聊天不够直观？推荐安装Open WebUI，它提供一个类似ChatGPT的网页界面。在终端执行：

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main（如果你没有Docker，也可以从GitHub下载桌面版）。

然后打开浏览器访问http://localhost:3000，注册一个本地账号，就能在新界面中选择你下载的模型聊天了。

常见坑和下一步

模型回复乱码？ 可能是聊天模板不对。下载模型时优先选官方提供的GGUF格式文件，或用Ollama的默认模板。
显存不够？ 先试试更小的模型，如qwen2.5:1.5b或phi4-mini。
想用自己的文档？ 可以学习RAG（检索增强生成，让AI能读取PDF、代码等文件并回答相关问题），后续教程会展开。

现在你已经成功在本地跑起了AI模型！下一步可以探索更多模型（如DeepSeek、GLM系列），或学习用Modelfile自定义模型参数。

内容来源

DEV Ollama

发布时间

2026-05-28 01:38