极客前沿

AI 入门实战:从零搭建医学图像脱敏工具

2026-05-24 01:30
freeCodeCamp
查看原文

学会安装 Python、PyTorch 和 MONAI,并用它们对医学图像进行自动脱敏处理。

准备环境:装好 Python 和必备工具

首先,你需要一台电脑(Windows / macOS / Linux 都可以),然后安装 Python(一种编程语言,用来运行 AI 程序)。建议从 python.org 下载 3.8 到 3.11 版本,安装时记得勾选“Add Python to PATH”。

安装完成后,打开命令行(Windows 搜索“cmd”,Mac 搜索“终端”),输入 python --version 确认显示版本号。如果提示“不是内部命令”,说明 PATH 没加对,重新安装并勾选即可。

安装 PyTorch 和 MONAI

PyTorch 是一个 AI 框架,用来训练和运行深度学习模型。MONAI 是专门为医学图像设计的 PyTorch 扩展库。在命令行中依次运行以下命令:

Tutorial Image
  1. 升级 pip:python -m pip install --upgrade pip
  2. 安装 PyTorch(CPU 版):pip install torch torchvision(如果你有 NVIDIA 显卡,可以去 pytorch.org 选 CUDA 版本)
  3. 安装 MONAI:pip install monai
  4. 安装其他依赖:pip install pydicom pytesseract pillowpydicom 用于读取 DICOM 文件,pytesseract 是 OCR 工具,pillow 处理图像)

常见坑:安装 pytesseract 前需要单独安装 Tesseract OCR 引擎(从 GitHub 下载安装包),否则会报错。

验证是否成功:跑一个简单例子

新建一个文本文件,命名为 test.py,用记事本打开,粘贴以下代码:

import monai
print("MONAI 版本:", monai.__version__)

保存后,在命令行中运行 python test.py,如果输出类似 MONAI 版本: 1.3.0,说明安装成功。

Tutorial Image

接下来,你可以用 MONAI 自带的脱敏工具处理一张 DICOM 图像。参考官方文档中的 RemovePatientIdentifiersd 变换,一行代码就能移除元数据中的患者信息。

下一步可以做什么

现在你已经有了基础环境。可以尝试:

  • OCR(光学字符识别,即从图片中提取文字)检测图像中烧录的文字,并用模糊或遮盖去除。
  • NER(命名实体识别,即自动找出人名、日期等敏感词)智能识别并替换。
  • 将脱敏后的图像保存为 PNG 或新的 DICOM 文件,用于研究或训练 AI 模型。

记住,脱敏后的数据要确保无法还原患者身份,这是合规的关键。

内容来源

freeCodeCamp

发布时间

2026-05-24 01:30

返回 AI技术