AI 入门实战:从零搭建你的第一个搜索应用
学会安装 Python、下载代码、运行第一个 AI 搜索 demo,理解多语言搜索的坑。
准备环境
你需要一台能上网的电脑,安装 Python(一种写 AI 程序的编程语言)。去 python.org 下载 3.8 以上版本,安装时勾选“Add Python to PATH”。打开终端(Windows 用 cmd,Mac 用终端),输入 python --version 看到版本号即成功。
安装依赖
- 创建一个文件夹,比如
ai-search。 - 在该文件夹内打开终端,输入
pip install sentence-transformers安装 sentence-transformers(一个把文字变成向量的工具,向量就是数字列表,方便计算机比较意思)。 - 再输入
pip install flask安装 Flask(一个简单的网页服务器)。
运行第一个 demo
- 在文件夹里新建文件
app.py,用记事本打开。 - 复制以下代码:
from flask import Flask, request, jsonify from sentence_transformers import SentenceTransformer import numpy as np app = Flask(__name__) model = SentenceTransformer('paraphrase-multilingual-MiniLM-L12-v2') @app.route('/search', methods=['POST']) def search(): query = request.json['query'] query_vec = model.encode([query]) # 这里简化:返回向量长度 return jsonify({'vector_length': len(query_vec[0])}) if __name__ == '__main__': app.run() - 在终端输入
python app.py,看到Running on http://127.0.0.1:5000表示启动成功。 - 打开另一个终端,输入
curl -X POST http://127.0.0.1:5000/search -H "Content-Type: application/json" -d '{"query":"你好"}',返回{"vector_length": 384}就对了。
常见坑与下一步
- 坑:如果
pip install很慢,可以加-i https://pypi.tuna.tsinghua.edu.cn/simple用国内镜像。 - 坑:中文搜索效果差?默认模型对中文支持一般,可以换成 shibing624/text2vec-base-chinese,在代码里改模型名即可。
- 下一步:尝试加入更多文档,用
model.encode把文档也转成向量,然后计算相似度,实现真正的搜索。
内容来源
DEV Machine Learning
发布时间
2026-05-29 01:33