AI 入门实战:从零搭建医学图像脱敏工具
学会安装 Python、PyTorch 和 MONAI,并用它们对医学图像进行自动脱敏处理。
准备环境:装好 Python 和必备工具
首先,你需要一台电脑(Windows / macOS / Linux 都可以),然后安装 Python(一种编程语言,用来运行 AI 程序)。建议从 python.org 下载 3.8 到 3.11 版本,安装时记得勾选“Add Python to PATH”。
安装完成后,打开命令行(Windows 搜索“cmd”,Mac 搜索“终端”),输入 python --version 确认显示版本号。如果提示“不是内部命令”,说明 PATH 没加对,重新安装并勾选即可。
安装 PyTorch 和 MONAI
PyTorch 是一个 AI 框架,用来训练和运行深度学习模型。MONAI 是专门为医学图像设计的 PyTorch 扩展库。在命令行中依次运行以下命令:
- 升级 pip:
python -m pip install --upgrade pip - 安装 PyTorch(CPU 版):
pip install torch torchvision(如果你有 NVIDIA 显卡,可以去 pytorch.org 选 CUDA 版本) - 安装 MONAI:
pip install monai - 安装其他依赖:
pip install pydicom pytesseract pillow(pydicom 用于读取 DICOM 文件,pytesseract 是 OCR 工具,pillow 处理图像)
常见坑:安装 pytesseract 前需要单独安装 Tesseract OCR 引擎(从 GitHub 下载安装包),否则会报错。
验证是否成功:跑一个简单例子
新建一个文本文件,命名为 test.py,用记事本打开,粘贴以下代码:
import monai
print("MONAI 版本:", monai.__version__)
保存后,在命令行中运行 python test.py,如果输出类似 MONAI 版本: 1.3.0,说明安装成功。
接下来,你可以用 MONAI 自带的脱敏工具处理一张 DICOM 图像。参考官方文档中的 RemovePatientIdentifiersd 变换,一行代码就能移除元数据中的患者信息。
下一步可以做什么
现在你已经有了基础环境。可以尝试:
- 用 OCR(光学字符识别,即从图片中提取文字)检测图像中烧录的文字,并用模糊或遮盖去除。
- 用 NER(命名实体识别,即自动找出人名、日期等敏感词)智能识别并替换。
- 将脱敏后的图像保存为 PNG 或新的 DICOM 文件,用于研究或训练 AI 模型。
记住,脱敏后的数据要确保无法还原患者身份,这是合规的关键。
内容来源
freeCodeCamp
发布时间
2026-05-24 01:30