AI 入门:用 ChromaDB 搭建你的第一个向量数据库
学会安装 ChromaDB,创建向量数据库,添加文档并搜索相似内容,零基础可上手。
准备环境
你需要一台能上网的电脑,安装好 Python(一种编程语言,用来写代码)和 pip(Python 的包管理工具,用来安装其他工具)。如果没有,去 python.org 下载 Python 3.8 以上版本,安装时勾选“Add Python to PATH”。
安装 ChromaDB
ChromaDB 是一个向量数据库,它能把文字变成数字列表(向量),然后帮你找到相似的内容。比如,你可以存一堆文档,然后问问题,它会找出最相关的几篇。
- 打开命令行(Windows 按 Win+R 输入 cmd,Mac 打开终端)。
- 输入以下命令并回车:
pip install chromadb - 等待安装完成,看到 Successfully installed 就成功了。
常见坑:如果提示“pip 不是内部命令”,说明 Python 没装好,重新安装并勾选“Add to PATH”。如果安装慢,可以换成国内镜像:pip install chromadb -i https://pypi.tuna.tsinghua.edu.cn/simple
验证是否成功
打开 Python 交互环境(命令行输入 python),然后逐行输入以下代码:
import chromadb# 导入 ChromaDBclient = chromadb.Client()# 创建客户端collection = client.create_collection("my_collection")# 新建一个集合,类似文件夹collection.add(documents=["今天天气真好", "明天要下雨"], ids=["1", "2"])# 添加文档results = collection.query(query_texts=["天气如何"], n_results=1)# 查询最相关的文档print(results)# 打印结果
如果输出包含“今天天气真好”,说明一切正常!你刚刚用向量数据库找到了相似内容。
下一步可以做什么
现在你可以:
- 把更多文档存入数据库,比如你的笔记或文章。
- 结合 大语言模型(如 ChatGPT),先搜索相关文档,再让模型根据文档回答,避免模型胡说八道。
- 学习如何持久化保存数据(重启后不丢失),参考官方文档。
恭喜你,已经迈出了 AI 应用的第一步!
内容来源
Real Python
发布时间
2026-05-11 01:30