零基础用 Python 抓取招聘数据:环境安装到跑通
从零开始,学会安装 Python、配置环境、运行脚本,抓取 Workable 招聘网站的公开 JSON 数据。
很多公司用 Workable 管理招聘信息,这些信息其实可以通过公开的 JSON 接口获取——不需要 API 密钥,不需要登录,甚至不需要浏览器。本文带你从零开始,安装好环境,写几行 Python 代码,就能抓取到完整的职位列表。
准备环境:安装 Python 和 pip
首先,你的电脑上需要 Python(一种编程语言)。如果你还没装:
- 去 python.org 下载最新版(比如 3.11 或 3.12)。
- 安装时记得勾选“Add Python to PATH”,这样你才能在命令行里直接使用 python 命令。
- 安装完成后,打开终端(Windows 是命令提示符或 PowerShell,Mac 是终端),输入
python --version,看到版本号就说明成功了。
Python 安装包自带 pip(Python 的包管理器,用来安装别人写好的代码库)。在终端输入 pip --version 检查是否可用。
安装必要库:requests
我们要用 requests 库(一个让 Python 轻松发送网络请求的工具)来获取数据。在终端执行:
pip install requests
等待安装完成。如果遇到权限问题,Mac/Linux 用户可以在前面加 sudo,Windows 用户可以用管理员身份运行终端。
抓取 Workable 职位数据
Workable 的每个公司招聘页面背后都有一个公开的 JSON 接口。比如公司“pearltalent”的招聘网址是 https://apply.workable.com/pearltalent/,那么它的 JSON 接口就是:https://apply.workable.com/api/v1/pearltalent/jobs?details=true。
我们写一个简单的 Python 脚本来获取数据:
- 新建一个文本文件,命名为
fetch_jobs.py。 - 用记事本或任何代码编辑器打开,输入以下内容:
import requests url = 'https://apply.workable.com/api/v1/pearltalent/jobs?details=true' response = requests.get(url) data = response.json() for job in data['jobs']: print(job['title'], job['location']['city']) - 保存文件,然后在终端中进入该文件所在目录,执行
python fetch_jobs.py。
如果一切正常,你会看到打印出的职位名称和城市。注意:不同公司的短代码不同,你需要把 pearltalent 替换成你要查的公司短代码。
常见问题与下一步
- 请求失败? 检查网络,或者公司短代码是否正确。短代码就是招聘网址中
apply.workable.com/后面的那部分。 - 返回空数据? 有些公司可能没有公开职位,或者接口有变化。可以试试换个公司。
- 下一步学什么? 你可以把抓到的数据保存成 CSV 文件,或者用 pandas 做分析。另外,注意抓取频率不要太高,尊重网站的使用条款。
现在你已经迈出了第一步!用同样的思路,你可以抓取任何提供 JSON 接口的网站数据。享受编程的乐趣吧。
内容来源
DEV Tutorial
发布时间
2026-06-03 01:31