AI 入门:本地文档处理工具安装与使用
学会安装 Ollama 和 Gradio,搭建一个完全离线的 AI 文档处理器,保护隐私。
准备环境
你不需要高性能电脑或云服务。只需要一台能联网的电脑,以及基本的命令行操作能力。本教程将带你安装两个工具:Ollama(一个本地的 AI 模型运行工具,相当于在你的电脑里装一个小型 AI 大脑)和 Gradio(一个快速构建网页界面的 Python 库,用来给 AI 做个可视化操作面板)。
安装步骤
- 安装 Ollama:访问 ollama.com,下载对应操作系统的安装包。Windows 用户双击安装,Mac/Linux 用户按官网命令安装。安装后打开终端(命令提示符),输入
ollama pull qwen2:0.5b,等待下载完成。这个命令会下载一个轻量级 AI 模型(约 0.5B 参数),适合初学者体验。 - 安装 Python 和 Gradio:如果电脑没有 Python,先去 python.org 下载安装(记得勾选“Add Python to PATH”)。然后打开终端,输入
pip install gradio安装 Gradio。 - 创建处理脚本:新建一个文本文件,命名为
app.py,复制以下代码:import gradio as gr import subprocess def process_document(file): # 调用 Ollama 处理文件 result = subprocess.run(['ollama', 'run', 'qwen2:0.5b', '--prompt', '请总结这个文档'], capture_output=True, text=True) return result.stdout iface = gr.Interface(fn=process_document, inputs=gr.File(label='上传文档'), outputs='text') iface.launch() - 运行应用:在终端中进入
app.py所在目录,输入python app.py。看到输出Running on local URL: http://127.0.0.1:7860表示成功。打开浏览器访问该地址,上传一个 .txt 文件,点击提交,稍等片刻就会看到 AI 的总结结果。
验证是否成功
为了确认所有操作都在本地完成,没有数据外传,可以打开Wireshark(网络抓包工具)过滤 !host 127.0.0.1,然后上传文档处理。如果没有任何网络数据包出现,就证明你的文档没有离开电脑。对于新手,这一步可跳过,但建议了解——这是保护隐私的关键。
下一步可以做什么
- 尝试不同模型:在 Ollama 官网查看其他模型,如
llama3.2(更适合英文)或mistral,用ollama pull 模型名下载后修改脚本中的模型名称即可。 - 优化提示词:修改代码中的
--prompt参数,例如改为“提取关键信息”或“翻译成英文”,让 AI 输出更符合需求。 - 处理更多文件类型:安装
python-docx库(pip install python-docx)和PyPDF2,可以处理 Word 和 PDF 文件。
现在你已经成功跑通了第一个本地 AI 应用!整个过程零成本、完全离线,适合处理敏感文档。遇到问题可以搜索“Ollama 常见问题”或查看官方文档。祝你在 AI 入门之路上越走越远!
内容来源
DEV Ollama
发布时间
2026-05-30 01:33