极客前沿

AI 入门:用 ChromaDB 搭建你的第一个向量数据库

2026-05-11 01:30
Real Python
查看原文

学会安装 ChromaDB,创建向量数据库,添加文档并搜索相似内容,零基础可上手。

准备环境

你需要一台能上网的电脑,安装好 Python(一种编程语言,用来写代码)和 pip(Python 的包管理工具,用来安装其他工具)。如果没有,去 python.org 下载 Python 3.8 以上版本,安装时勾选“Add Python to PATH”。

Tutorial Image

安装 ChromaDB

ChromaDB 是一个向量数据库,它能把文字变成数字列表(向量),然后帮你找到相似的内容。比如,你可以存一堆文档,然后问问题,它会找出最相关的几篇。

Tutorial Image
  1. 打开命令行(Windows 按 Win+R 输入 cmd,Mac 打开终端)。
  2. 输入以下命令并回车:pip install chromadb
  3. 等待安装完成,看到 Successfully installed 就成功了。

常见坑:如果提示“pip 不是内部命令”,说明 Python 没装好,重新安装并勾选“Add to PATH”。如果安装慢,可以换成国内镜像:pip install chromadb -i https://pypi.tuna.tsinghua.edu.cn/simple

Tutorial Image

验证是否成功

打开 Python 交互环境(命令行输入 python),然后逐行输入以下代码:

Tutorial Image
  1. import chromadb # 导入 ChromaDB
  2. client = chromadb.Client() # 创建客户端
  3. collection = client.create_collection("my_collection") # 新建一个集合,类似文件夹
  4. collection.add(documents=["今天天气真好", "明天要下雨"], ids=["1", "2"]) # 添加文档
  5. results = collection.query(query_texts=["天气如何"], n_results=1) # 查询最相关的文档
  6. print(results) # 打印结果

如果输出包含“今天天气真好”,说明一切正常!你刚刚用向量数据库找到了相似内容。

下一步可以做什么

现在你可以:

  • 把更多文档存入数据库,比如你的笔记或文章。
  • 结合 大语言模型(如 ChatGPT),先搜索相关文档,再让模型根据文档回答,避免模型胡说八道。
  • 学习如何持久化保存数据(重启后不丢失),参考官方文档。

恭喜你,已经迈出了 AI 应用的第一步!

内容来源

Real Python

发布时间

2026-05-11 01:30

返回 AI技术