极客前沿

AI 入门:从零开始搭建你的第一个模型

2026-05-23 01:31
DEV Tutorial
查看原文

本文面向零基础读者,手把手教你安装 Python、Jupyter 和 TensorFlow,并运行第一个 AI 程序。

想学 AI 但不知从何下手?别担心,这篇教程会带你一步步装好工具,并跑通第一个简单的模型。你只需要一台能上网的电脑,跟着做就行。

准备环境:装好 Python 和 Jupyter

AI 开发最常用的语言是 Python(一种容易学的编程语言)。你需要先安装它。

  • 打开浏览器,访问 Python 官网 python.org/downloads,下载最新版(推荐 3.10 或更高)。
  • 安装时记得勾选“Add Python to PATH”(把 Python 加入系统路径),否则后面可能找不到命令。
  • 安装完成后,打开命令提示符(Windows 按 Win+R 输入 cmd,Mac 打开终端),输入 python --version,看到版本号就说明成功了。

接下来安装 Jupyter Notebook(一个写代码的交互式笔记本)。在命令提示符里输入:

Tutorial Image
  • pip install jupyter(pip 是 Python 的包管理器,自动下载安装)。
  • 等几分钟,安装完成后输入 jupyter notebook,浏览器会自动打开一个页面,这就是你的编程环境。

安装 AI 库:TensorFlow 和 Keras

现在装核心的 AI 库。TensorFlow 是 Google 开发的 AI 框架,Keras 是它的高级接口,让写模型更简单。

  • 在 Jupyter 里新建一个 Notebook(点右上角 New → Python 3)。
  • 在第一个代码单元格里输入:!pip install tensorflow,然后按 Shift+Enter 运行,等待安装完成。
  • 安装成功后,再输入 import tensorflow as tf,没有报错就说明库已经装好了。

跑通第一个模型:手写数字识别

我们用经典的 MNIST 数据集(手写数字图片)训练一个简单的识别模型。复制下面代码到新单元格并运行:

  1. mnist = tf.keras.datasets.mnist 加载数据集。
  2. (x_train, y_train), (x_test, y_test) = mnist.load_data() 分成训练和测试数据。
  3. x_train, x_test = x_train / 255.0, x_test / 255.0 把像素值缩放到 0~1 之间。
  4. model = tf.keras.models.Sequential([ tf.keras.layers.Flatten(input_shape=(28, 28)), tf.keras.layers.Dense(128, activation='relu'), tf.keras.layers.Dropout(0.2), tf.keras.layers.Dense(10) ]) 搭建一个简单的神经网络。
  5. model.compile(optimizer='adam', loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True), metrics=['accuracy']) 配置模型。
  6. model.fit(x_train, y_train, epochs=5) 训练 5 轮。
  7. model.evaluate(x_test, y_test) 在测试集上评估,正确率大约 97%。

看到输出里 accuracy 接近 0.97 就说明你成功跑通了第一个 AI 模型!

下一步可以做什么

  • 试着改改 epochs(训练轮数)看准确率变化。
  • 用自己画的数字图片来测试模型(需要安装 PIL 库)。
  • 学习更多教程,比如用 TensorFlow 做图片分类、文本分析等。

恭喜你入门了 AI!

内容来源

DEV Tutorial

发布时间

2026-05-23 01:31

返回 AI技术