极客前沿

本地跑AI模型入门:从安装到第一次跑通

2026-05-28 01:38
DEV Ollama
查看原文

手把手教你安装Ollama,下载并运行开源AI模型,无需高端显卡,零基础也能上手。

想试试AI但又不想每月花几百块买API?其实你手头的电脑就能跑。本教程带你从零开始,在本地安装环境、下载模型,并成功运行一个类似ChatGPT的AI助手。全程免费,只需跟着步骤走。

准备环境:你需要什么?

跑AI模型最关键的硬件是显卡的显存(VRAM,即显卡专用内存)。好消息是:5年前的RTX 3060就能流畅运行7B参数级别的模型,速度够日常聊天、写代码、分析文档。如果你只有笔记本电脑,推荐先试Qwen 2.5:1.5bPhi-4 Mini,它们对硬件要求极低。

安装Ollama:AI模型的“应用商店”

Ollama是一个让你轻松下载和运行AI模型的工具,就像手机上的应用商店。去ollama.com/download下载对应你系统的安装包(Windows、macOS、Linux都有),双击安装即可。安装完成后,打开终端(Windows搜索“cmd”或“PowerShell”),输入以下命令测试是否成功:

  • ollama --version 如果显示版本号,说明安装成功。

下载并运行你的第一个模型

Ollama安装好后,就可以拉取模型了。我们选一个适合新手的中文模型:Qwen 2.5:7b(通义千问系列,中文能力很强)。在终端输入:

Tutorial Image
  1. ollama pull qwen2.5:7b 等待下载完成(约4GB,网速不同耗时不同)。
  2. ollama run qwen2.5:7b 模型启动后,你就可以在终端里直接跟它对话了。

输入任意问题,比如“你好,请介绍一下你自己”,模型就会回复。按Ctrl+D或输入/bye退出对话。

验证成功:用网页界面聊得更爽

终端聊天不够直观?推荐安装Open WebUI,它提供一个类似ChatGPT的网页界面。在终端执行:

  • docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main(如果你没有Docker,也可以从GitHub下载桌面版)。

然后打开浏览器访问http://localhost:3000,注册一个本地账号,就能在新界面中选择你下载的模型聊天了。

常见坑和下一步

  • 模型回复乱码? 可能是聊天模板不对。下载模型时优先选官方提供的GGUF格式文件,或用Ollama的默认模板。
  • 显存不够? 先试试更小的模型,如qwen2.5:1.5bphi4-mini
  • 想用自己的文档? 可以学习RAG(检索增强生成,让AI能读取PDF、代码等文件并回答相关问题),后续教程会展开。

现在你已经成功在本地跑起了AI模型!下一步可以探索更多模型(如DeepSeek、GLM系列),或学习用Modelfile自定义模型参数。

内容来源

DEV Ollama

发布时间

2026-05-28 01:38

返回 AI技术