AI 入门:从零开始搭建你的第一个模型
本文面向零基础读者,手把手教你安装 Python、Jupyter 和 TensorFlow,并运行第一个 AI 程序。
想学 AI 但不知从何下手?别担心,这篇教程会带你一步步装好工具,并跑通第一个简单的模型。你只需要一台能上网的电脑,跟着做就行。
准备环境:装好 Python 和 Jupyter
AI 开发最常用的语言是 Python(一种容易学的编程语言)。你需要先安装它。
- 打开浏览器,访问 Python 官网 python.org/downloads,下载最新版(推荐 3.10 或更高)。
- 安装时记得勾选“Add Python to PATH”(把 Python 加入系统路径),否则后面可能找不到命令。
- 安装完成后,打开命令提示符(Windows 按 Win+R 输入 cmd,Mac 打开终端),输入
python --version,看到版本号就说明成功了。
接下来安装 Jupyter Notebook(一个写代码的交互式笔记本)。在命令提示符里输入:
pip install jupyter(pip 是 Python 的包管理器,自动下载安装)。- 等几分钟,安装完成后输入
jupyter notebook,浏览器会自动打开一个页面,这就是你的编程环境。
安装 AI 库:TensorFlow 和 Keras
现在装核心的 AI 库。TensorFlow 是 Google 开发的 AI 框架,Keras 是它的高级接口,让写模型更简单。
- 在 Jupyter 里新建一个 Notebook(点右上角 New → Python 3)。
- 在第一个代码单元格里输入:
!pip install tensorflow,然后按 Shift+Enter 运行,等待安装完成。 - 安装成功后,再输入
import tensorflow as tf,没有报错就说明库已经装好了。
跑通第一个模型:手写数字识别
我们用经典的 MNIST 数据集(手写数字图片)训练一个简单的识别模型。复制下面代码到新单元格并运行:
mnist = tf.keras.datasets.mnist加载数据集。(x_train, y_train), (x_test, y_test) = mnist.load_data()分成训练和测试数据。x_train, x_test = x_train / 255.0, x_test / 255.0把像素值缩放到 0~1 之间。model = tf.keras.models.Sequential([ tf.keras.layers.Flatten(input_shape=(28, 28)), tf.keras.layers.Dense(128, activation='relu'), tf.keras.layers.Dropout(0.2), tf.keras.layers.Dense(10) ])搭建一个简单的神经网络。model.compile(optimizer='adam', loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True), metrics=['accuracy'])配置模型。model.fit(x_train, y_train, epochs=5)训练 5 轮。model.evaluate(x_test, y_test)在测试集上评估,正确率大约 97%。
看到输出里 accuracy 接近 0.97 就说明你成功跑通了第一个 AI 模型!
下一步可以做什么
- 试着改改 epochs(训练轮数)看准确率变化。
- 用自己画的数字图片来测试模型(需要安装 PIL 库)。
- 学习更多教程,比如用 TensorFlow 做图片分类、文本分析等。
恭喜你入门了 AI!
内容来源
DEV Tutorial
发布时间
2026-05-23 01:31