极客前沿

AI 入门实战:从零搭建你的第一个搜索应用

2026-05-29 01:33
DEV Machine Learning
查看原文

学会安装 Python、下载代码、运行第一个 AI 搜索 demo,理解多语言搜索的坑。

准备环境

你需要一台能上网的电脑,安装 Python(一种写 AI 程序的编程语言)。去 python.org 下载 3.8 以上版本,安装时勾选“Add Python to PATH”。打开终端(Windows 用 cmd,Mac 用终端),输入 python --version 看到版本号即成功。

安装依赖

  • 创建一个文件夹,比如 ai-search
  • 在该文件夹内打开终端,输入 pip install sentence-transformers 安装 sentence-transformers(一个把文字变成向量的工具,向量就是数字列表,方便计算机比较意思)。
  • 再输入 pip install flask 安装 Flask(一个简单的网页服务器)。

运行第一个 demo

  1. 在文件夹里新建文件 app.py,用记事本打开。
  2. 复制以下代码:
    from flask import Flask, request, jsonify
    from sentence_transformers import SentenceTransformer
    import numpy as np
    
    app = Flask(__name__)
    model = SentenceTransformer('paraphrase-multilingual-MiniLM-L12-v2')
    
    @app.route('/search', methods=['POST'])
    def search():
        query = request.json['query']
        query_vec = model.encode([query])
        # 这里简化:返回向量长度
        return jsonify({'vector_length': len(query_vec[0])})
    
    if __name__ == '__main__':
        app.run()
  3. 在终端输入 python app.py,看到 Running on http://127.0.0.1:5000 表示启动成功。
  4. 打开另一个终端,输入 curl -X POST http://127.0.0.1:5000/search -H "Content-Type: application/json" -d '{"query":"你好"}',返回 {"vector_length": 384} 就对了。

常见坑与下一步

  • :如果 pip install 很慢,可以加 -i https://pypi.tuna.tsinghua.edu.cn/simple 用国内镜像。
  • :中文搜索效果差?默认模型对中文支持一般,可以换成 shibing624/text2vec-base-chinese,在代码里改模型名即可。
  • 下一步:尝试加入更多文档,用 model.encode 把文档也转成向量,然后计算相似度,实现真正的搜索。

内容来源

DEV Machine Learning

发布时间

2026-05-29 01:33

返回 AI技术