RAG 入门实战:一步步搭建你的第一个检索增强系统
零基础搭建 RAG 系统,涵盖环境安装、核心步骤和验证方法,让你快速上手。
准备环境:你需要装什么
在开始之前,先了解两个核心概念:
- LLM(大语言模型):能理解和生成文字的 AI 模型,比如 ChatGPT 背后的技术。
- RAG(检索增强生成):让 LLM 先从外部资料库中查找相关信息,再根据这些信息生成回答,避免“瞎编”。
你需要安装以下工具:
- Python 3.8 或更高版本(从 python.org 下载,安装时勾选“Add Python to PATH”)。
- pip(Python 的包管理器,一般随 Python 自动安装)。
- 文本编辑器(推荐 VS Code 或 Notepad++)。
常见坑:安装 Python 后,在终端输入 python --version 确认版本;如果提示找不到命令,请重新安装并勾选“Add to PATH”。
安装步骤:一行命令搞定核心库
打开终端(Windows 用 cmd 或 PowerShell,Mac/Linux 用 Terminal),执行以下命令安装 RAG 所需的主要库:
pip install langchain chromadb openai
解释一下:
- LangChain:一个帮你搭建 AI 应用的框架,简化了调用 LLM 和操作数据的流程。
- ChromaDB:一个轻量级的向量数据库,用来存储和检索文本片段。
- OpenAI:这里指 OpenAI 的 Python 库,用于调用 GPT 模型(需要 API Key)。
常见坑:如果安装速度慢,可以试试 pip install -i https://pypi.tuna.tsinghua.edu.cn/simple langchain chromadb openai 使用清华镜像。
验证是否成功:跑通第一个 RAG 示例
新建一个 Python 文件(比如 test_rag.py),粘贴以下代码:
from langchain.vectorstores import Chroma
from langchain.embeddings import OpenAIEmbeddings
from langchain.text_splitter import CharacterTextSplitter
from langchain.llms import OpenAI
from langchain.chains import RetrievalQA
# 1. 准备一段示例文本
text = "人工智能(AI)是计算机科学的一个分支,致力于创造能够模拟人类智能的系统。"
# 2. 将文本切分成小块
text_splitter = CharacterTextSplitter(chunk_size=50, chunk_overlap=0)
texts = text_splitter.split_text(text)
# 3. 生成嵌入并存入 ChromaDB
embeddings = OpenAIEmbeddings(openai_api_key="你的API密钥")
docsearch = Chroma.from_texts(texts, embeddings)
# 4. 创建检索问答链
qa = RetrievalQA.from_chain_type(llm=OpenAI(openai_api_key="你的API密钥"), chain_type="stuff", retriever=docsearch.as_retriever())
# 5. 提问并打印答案
query = "什么是人工智能?"
print(qa.run(query))运行代码:在终端输入 python test_rag.py。如果输出类似“人工智能是计算机科学的一个分支……”的句子,说明成功了!
常见坑:需要提前申请 OpenAI API Key(访问 platform.openai.com 注册并创建密钥),代码中替换“你的API密钥”。
下一步可以做什么
- 替换为自己的文档:用
langchain.document_loaders加载 PDF、TXT 等文件。 - 尝试不同的 LLM:比如使用本地模型(如 llama.cpp)代替 OpenAI。
- 优化检索效果:调整
chunk_size和chunk_overlap参数。
恭喜你,已经迈出了 RAG 实战的第一步!
内容来源
DEV Tutorial
发布时间
2026-05-26 01:31