AI 入门实战：从零搭建你自己的知识图谱检索系统

手把手教你安装 Python、Jupyter Notebook，并运行一个简单的向量检索示例，体验 AI 项目的完整流程。

准备环境：装好 Python 和 Jupyter

首先，你需要安装 Python（一种编程语言，AI 项目最常用它）。去 python.org 下载最新版，安装时记得勾选“Add Python to PATH”。

然后打开终端（Windows 下按 Win+R 输入 cmd，Mac 下打开“终端”），输入：

pip install jupyter —— 安装 Jupyter Notebook（一个在浏览器里写代码的工具，方便边写边看结果）

装好后，输入 jupyter notebook 启动，浏览器会自动打开一个页面。

安装向量检索库：让机器理解相似性

我们用一个叫 FAISS 的库（Facebook 开源的向量检索工具，可以快速在大量数据中找到相似内容）。在 Jupyter 的代码单元格里输入：

!pip install faiss-cpu sentence-transformers —— sentence-transformers 能把文字变成向量（一串数字），FAISS 用这些数字做搜索。

写代码：第一次跑通向量检索

新建一个笔记本，输入以下代码（每段分别放在一个单元格里，按 Shift+Enter 运行）：

from sentence_transformers import SentenceTransformer
model = SentenceTransformer('all-MiniLM-L6-v2') —— 加载一个预训练模型，把句子变成向量。
sentences = ['钢铁关税上调', '轮胎反倾销调查', '韩国出口管制']
embeddings = model.encode(sentences) —— 把三个句子转成向量。
import faiss
index = faiss.IndexFlatL2(embeddings.shape[1]) —— 创建一个索引，用来存向量并做搜索。
index.add(embeddings) —— 把三个向量加进去。
query = '钢铁政策'
query_vec = model.encode([query])
distances, indices = index.search(query_vec, k=2) —— 搜索最相似的 2 个句子。
print(indices) —— 打印结果，应该显示 [0, 1] 表示第一个句子最相关。

常见坑：如果报错 ModuleNotFoundError，说明没装好库，用 !pip install 重新装。如果 Jupyter 没反应，重启内核（Kernel -> Restart）。

下一步：理解 Graph RAG 的概念

你刚刚实现的是最基本的向量检索。更高级的 Graph RAG（一种结合知识图谱的检索增强生成方法）会把实体和关系提取出来，形成网络。比如“钢铁关税”和“韩国出口”如果有关联，Graph RAG 能发现“为什么”而不只是“相似”。你现在可以搜索“Graph RAG 入门”继续学习，或者尝试用 LangChain 库搭建一个完整的问答系统。

内容来源

DEV Machine Learning

发布时间

2026-06-03 01:32