RAG 入门实战：一步步搭建你的第一个检索增强系统

零基础搭建 RAG 系统，涵盖环境安装、核心步骤和验证方法，让你快速上手。

准备环境：你需要装什么

在开始之前，先了解两个核心概念：

LLM（大语言模型）：能理解和生成文字的 AI 模型，比如 ChatGPT 背后的技术。
RAG（检索增强生成）：让 LLM 先从外部资料库中查找相关信息，再根据这些信息生成回答，避免“瞎编”。

你需要安装以下工具：

Python 3.8 或更高版本（从 python.org 下载，安装时勾选“Add Python to PATH”）。
pip（Python 的包管理器，一般随 Python 自动安装）。
文本编辑器（推荐 VS Code 或 Notepad++）。

常见坑：安装 Python 后，在终端输入 python --version 确认版本；如果提示找不到命令，请重新安装并勾选“Add to PATH”。

安装步骤：一行命令搞定核心库

打开终端（Windows 用 cmd 或 PowerShell，Mac/Linux 用 Terminal），执行以下命令安装 RAG 所需的主要库：

pip install langchain chromadb openai

解释一下：

LangChain：一个帮你搭建 AI 应用的框架，简化了调用 LLM 和操作数据的流程。
ChromaDB：一个轻量级的向量数据库，用来存储和检索文本片段。
OpenAI：这里指 OpenAI 的 Python 库，用于调用 GPT 模型（需要 API Key）。

常见坑：如果安装速度慢，可以试试 pip install -i https://pypi.tuna.tsinghua.edu.cn/simple langchain chromadb openai 使用清华镜像。

验证是否成功：跑通第一个 RAG 示例

新建一个 Python 文件（比如 test_rag.py），粘贴以下代码：

from langchain.vectorstores import Chroma
from langchain.embeddings import OpenAIEmbeddings
from langchain.text_splitter import CharacterTextSplitter
from langchain.llms import OpenAI
from langchain.chains import RetrievalQA

# 1. 准备一段示例文本
text = "人工智能（AI）是计算机科学的一个分支，致力于创造能够模拟人类智能的系统。"

# 2. 将文本切分成小块
text_splitter = CharacterTextSplitter(chunk_size=50, chunk_overlap=0)
texts = text_splitter.split_text(text)

# 3. 生成嵌入并存入 ChromaDB
embeddings = OpenAIEmbeddings(openai_api_key="你的API密钥")
docsearch = Chroma.from_texts(texts, embeddings)

# 4. 创建检索问答链
qa = RetrievalQA.from_chain_type(llm=OpenAI(openai_api_key="你的API密钥"), chain_type="stuff", retriever=docsearch.as_retriever())

# 5. 提问并打印答案
query = "什么是人工智能？"
print(qa.run(query))

运行代码：在终端输入 python test_rag.py。如果输出类似“人工智能是计算机科学的一个分支……”的句子，说明成功了！

常见坑：需要提前申请 OpenAI API Key（访问 platform.openai.com 注册并创建密钥），代码中替换“你的API密钥”。

下一步可以做什么

替换为自己的文档：用 langchain.document_loaders 加载 PDF、TXT 等文件。
尝试不同的 LLM：比如使用本地模型（如 llama.cpp）代替 OpenAI。
优化检索效果：调整 chunk_size 和 chunk_overlap 参数。

恭喜你，已经迈出了 RAG 实战的第一步！

内容来源

DEV Tutorial

发布时间

2026-05-26 01:31