极客前沿

AI 入门第一步:装好环境,跑通你的第一个模型

2026-05-25 01:32
DEV Machine Learning
查看原文

本文带你从零开始安装 Python、Jupyter 和 scikit-learn,并运行第一个分类模型,避开新手常见坑。

很多新手想学 AI,但一上来就被矩阵、线性代数吓住。其实你完全可以先动手跑通第一个模型,再慢慢补数学。本文带你完成环境安装和第一次模型运行。

准备开发环境

你需要一台电脑(Windows / macOS / Linux 均可)和网络。我们只用免费工具。

  • 安装 Python(一种编程语言,AI 最常用的语言):去 python.org 下载最新版(3.10+),安装时勾选“Add Python to PATH”。
  • 安装 Jupyter Notebook(一个写代码的网页工具,能边写边看结果):打开终端(Windows 用 cmd 或 PowerShell),输入 pip install jupyter 并回车。
  • 安装 scikit-learn(一个简单的机器学习库,封装了常用模型):终端输入 pip install scikit-learn

常见坑:如果提示“pip 不是命令”,说明 Python 没加到 PATH,重装时勾选即可。

启动 Jupyter 并新建笔记

  1. 终端输入 jupyter notebook,浏览器会自动打开一个页面。
  2. 点击右上角“New” → “Python 3”,新建一个笔记本。
  3. 你会看到一个单元格(cell),在里面输入代码,按 Shift+Enter 运行。

跑通你的第一个模型

我们用一个经典数据集——鸢尾花数据集(包含三种花的测量数据),训练一个分类模型。复制下面代码到单元格运行:

from sklearn.datasets import load_iris
from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

Tutorial Image

# 加载数据
iris = load_iris()
X = iris.data # 特征(花瓣长宽等)
y = iris.target # 标签(花的种类)

# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 创建并训练模型
model = KNeighborsClassifier()
model.fit(X_train, y_train)

# 预测并评估
y_pred = model.predict(X_test)
print('准确率:', accuracy_score(y_test, y_pred))

如果输出类似“准确率: 1.0”或接近 1 的数,说明模型跑通了!

下一步可以做什么

  • 换一个数据集:试试 load_digits()(手写数字识别)。
  • 换一个模型:把 KNeighborsClassifier 改成 LogisticRegression(逻辑回归,一种分类算法),记得先导入 from sklearn.linear_model import LogisticRegression
  • 学习基础数学:当模型效果不好时,理解矩阵运算会帮你调试。但别急,先享受跑通代码的成就感!

内容来源

DEV Machine Learning

发布时间

2026-05-25 01:32

返回 AI技术