极客前沿

AI 入门实战:从零搭建你自己的知识图谱检索系统

2026-06-03 01:32
DEV Machine Learning
查看原文

手把手教你安装 Python、Jupyter Notebook,并运行一个简单的向量检索示例,体验 AI 项目的完整流程。

准备环境:装好 Python 和 Jupyter

首先,你需要安装 Python(一种编程语言,AI 项目最常用它)。去 python.org 下载最新版,安装时记得勾选“Add Python to PATH”。

然后打开终端(Windows 下按 Win+R 输入 cmd,Mac 下打开“终端”),输入:

  • pip install jupyter —— 安装 Jupyter Notebook(一个在浏览器里写代码的工具,方便边写边看结果)

装好后,输入 jupyter notebook 启动,浏览器会自动打开一个页面。

Tutorial Image

安装向量检索库:让机器理解相似性

我们用一个叫 FAISS 的库(Facebook 开源的向量检索工具,可以快速在大量数据中找到相似内容)。在 Jupyter 的代码单元格里输入:

  • !pip install faiss-cpu sentence-transformers —— sentence-transformers 能把文字变成向量(一串数字),FAISS 用这些数字做搜索。

写代码:第一次跑通向量检索

新建一个笔记本,输入以下代码(每段分别放在一个单元格里,按 Shift+Enter 运行):

  1. from sentence_transformers import SentenceTransformer
    model = SentenceTransformer('all-MiniLM-L6-v2') —— 加载一个预训练模型,把句子变成向量。
  2. sentences = ['钢铁关税上调', '轮胎反倾销调查', '韩国出口管制']
    embeddings = model.encode(sentences) —— 把三个句子转成向量。
  3. import faiss
    index = faiss.IndexFlatL2(embeddings.shape[1]) —— 创建一个索引,用来存向量并做搜索。
    index.add(embeddings) —— 把三个向量加进去。
  4. query = '钢铁政策'
    query_vec = model.encode([query])
    distances, indices = index.search(query_vec, k=2) —— 搜索最相似的 2 个句子。
    print(indices) —— 打印结果,应该显示 [0, 1] 表示第一个句子最相关。

常见坑:如果报错 ModuleNotFoundError,说明没装好库,用 !pip install 重新装。如果 Jupyter 没反应,重启内核(Kernel -> Restart)。

下一步:理解 Graph RAG 的概念

你刚刚实现的是最基本的向量检索。更高级的 Graph RAG(一种结合知识图谱的检索增强生成方法)会把实体和关系提取出来,形成网络。比如“钢铁关税”和“韩国出口”如果有关联,Graph RAG 能发现“为什么”而不只是“相似”。你现在可以搜索“Graph RAG 入门”继续学习,或者尝试用 LangChain 库搭建一个完整的问答系统。

内容来源

DEV Machine Learning

发布时间

2026-06-03 01:32

返回 AI技术