极客前沿

AI 入门:本地文档处理工具安装与使用

2026-05-30 01:33
DEV Ollama
查看原文

学会安装 Ollama 和 Gradio,搭建一个完全离线的 AI 文档处理器,保护隐私。

准备环境

你不需要高性能电脑或云服务。只需要一台能联网的电脑,以及基本的命令行操作能力。本教程将带你安装两个工具:Ollama(一个本地的 AI 模型运行工具,相当于在你的电脑里装一个小型 AI 大脑)和 Gradio(一个快速构建网页界面的 Python 库,用来给 AI 做个可视化操作面板)。

Tutorial Image

安装步骤

  1. 安装 Ollama:访问 ollama.com,下载对应操作系统的安装包。Windows 用户双击安装,Mac/Linux 用户按官网命令安装。安装后打开终端(命令提示符),输入 ollama pull qwen2:0.5b,等待下载完成。这个命令会下载一个轻量级 AI 模型(约 0.5B 参数),适合初学者体验。
  2. 安装 Python 和 Gradio:如果电脑没有 Python,先去 python.org 下载安装(记得勾选“Add Python to PATH”)。然后打开终端,输入 pip install gradio 安装 Gradio。
  3. 创建处理脚本:新建一个文本文件,命名为 app.py,复制以下代码:
    import gradio as gr
    import subprocess
    
    def process_document(file):
        # 调用 Ollama 处理文件
        result = subprocess.run(['ollama', 'run', 'qwen2:0.5b', '--prompt', '请总结这个文档'], capture_output=True, text=True)
        return result.stdout
    
    iface = gr.Interface(fn=process_document, inputs=gr.File(label='上传文档'), outputs='text')
    iface.launch()
  4. 运行应用:在终端中进入 app.py 所在目录,输入 python app.py。看到输出 Running on local URL: http://127.0.0.1:7860 表示成功。打开浏览器访问该地址,上传一个 .txt 文件,点击提交,稍等片刻就会看到 AI 的总结结果。

验证是否成功

为了确认所有操作都在本地完成,没有数据外传,可以打开Wireshark(网络抓包工具)过滤 !host 127.0.0.1,然后上传文档处理。如果没有任何网络数据包出现,就证明你的文档没有离开电脑。对于新手,这一步可跳过,但建议了解——这是保护隐私的关键。

下一步可以做什么

  • 尝试不同模型:在 Ollama 官网查看其他模型,如 llama3.2(更适合英文)或 mistral,用 ollama pull 模型名 下载后修改脚本中的模型名称即可。
  • 优化提示词:修改代码中的 --prompt 参数,例如改为“提取关键信息”或“翻译成英文”,让 AI 输出更符合需求。
  • 处理更多文件类型:安装 python-docx 库(pip install python-docx)和 PyPDF2,可以处理 Word 和 PDF 文件。

现在你已经成功跑通了第一个本地 AI 应用!整个过程零成本、完全离线,适合处理敏感文档。遇到问题可以搜索“Ollama 常见问题”或查看官方文档。祝你在 AI 入门之路上越走越远!

内容来源

DEV Ollama

发布时间

2026-05-30 01:33

返回 AI技术