AI 入门第一步:装好环境,跑通你的第一个模型
本文带你从零开始安装 Python、Jupyter 和 scikit-learn,并运行第一个分类模型,避开新手常见坑。
很多新手想学 AI,但一上来就被矩阵、线性代数吓住。其实你完全可以先动手跑通第一个模型,再慢慢补数学。本文带你完成环境安装和第一次模型运行。
准备开发环境
你需要一台电脑(Windows / macOS / Linux 均可)和网络。我们只用免费工具。
- 安装 Python(一种编程语言,AI 最常用的语言):去 python.org 下载最新版(3.10+),安装时勾选“Add Python to PATH”。
- 安装 Jupyter Notebook(一个写代码的网页工具,能边写边看结果):打开终端(Windows 用 cmd 或 PowerShell),输入
pip install jupyter并回车。 - 安装 scikit-learn(一个简单的机器学习库,封装了常用模型):终端输入
pip install scikit-learn。
常见坑:如果提示“pip 不是命令”,说明 Python 没加到 PATH,重装时勾选即可。
启动 Jupyter 并新建笔记
- 终端输入
jupyter notebook,浏览器会自动打开一个页面。 - 点击右上角“New” → “Python 3”,新建一个笔记本。
- 你会看到一个单元格(cell),在里面输入代码,按 Shift+Enter 运行。
跑通你的第一个模型
我们用一个经典数据集——鸢尾花数据集(包含三种花的测量数据),训练一个分类模型。复制下面代码到单元格运行:
from sklearn.datasets import load_irisfrom sklearn.neighbors import KNeighborsClassifierfrom sklearn.model_selection import train_test_splitfrom sklearn.metrics import accuracy_score
# 加载数据iris = load_iris()X = iris.data # 特征(花瓣长宽等)y = iris.target # 标签(花的种类)
# 划分训练集和测试集X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 创建并训练模型model = KNeighborsClassifier()model.fit(X_train, y_train)
# 预测并评估y_pred = model.predict(X_test)print('准确率:', accuracy_score(y_test, y_pred))
如果输出类似“准确率: 1.0”或接近 1 的数,说明模型跑通了!
下一步可以做什么
- 换一个数据集:试试
load_digits()(手写数字识别)。 - 换一个模型:把
KNeighborsClassifier改成LogisticRegression(逻辑回归,一种分类算法),记得先导入from sklearn.linear_model import LogisticRegression。 - 学习基础数学:当模型效果不好时,理解矩阵运算会帮你调试。但别急,先享受跑通代码的成就感!
内容来源
DEV Machine Learning
发布时间
2026-05-25 01:32