极客前沿

零基础用 Python 抓取招聘数据:环境安装到跑通

2026-06-03 01:31
DEV Tutorial
查看原文

从零开始,学会安装 Python、配置环境、运行脚本,抓取 Workable 招聘网站的公开 JSON 数据。

很多公司用 Workable 管理招聘信息,这些信息其实可以通过公开的 JSON 接口获取——不需要 API 密钥,不需要登录,甚至不需要浏览器。本文带你从零开始,安装好环境,写几行 Python 代码,就能抓取到完整的职位列表。

准备环境:安装 Python 和 pip

首先,你的电脑上需要 Python(一种编程语言)。如果你还没装:

  • python.org 下载最新版(比如 3.11 或 3.12)。
  • 安装时记得勾选“Add Python to PATH”,这样你才能在命令行里直接使用 python 命令。
  • 安装完成后,打开终端(Windows 是命令提示符或 PowerShell,Mac 是终端),输入 python --version,看到版本号就说明成功了。

Python 安装包自带 pip(Python 的包管理器,用来安装别人写好的代码库)。在终端输入 pip --version 检查是否可用。

安装必要库:requests

我们要用 requests 库(一个让 Python 轻松发送网络请求的工具)来获取数据。在终端执行:

Tutorial Image
  • pip install requests

等待安装完成。如果遇到权限问题,Mac/Linux 用户可以在前面加 sudo,Windows 用户可以用管理员身份运行终端。

抓取 Workable 职位数据

Workable 的每个公司招聘页面背后都有一个公开的 JSON 接口。比如公司“pearltalent”的招聘网址是 https://apply.workable.com/pearltalent/,那么它的 JSON 接口就是:https://apply.workable.com/api/v1/pearltalent/jobs?details=true

我们写一个简单的 Python 脚本来获取数据:

  1. 新建一个文本文件,命名为 fetch_jobs.py
  2. 用记事本或任何代码编辑器打开,输入以下内容:
    import requests
    
    url = 'https://apply.workable.com/api/v1/pearltalent/jobs?details=true'
    response = requests.get(url)
    data = response.json()
    
    for job in data['jobs']:
        print(job['title'], job['location']['city'])
  3. 保存文件,然后在终端中进入该文件所在目录,执行 python fetch_jobs.py

如果一切正常,你会看到打印出的职位名称和城市。注意:不同公司的短代码不同,你需要把 pearltalent 替换成你要查的公司短代码。

常见问题与下一步

  • 请求失败? 检查网络,或者公司短代码是否正确。短代码就是招聘网址中 apply.workable.com/ 后面的那部分。
  • 返回空数据? 有些公司可能没有公开职位,或者接口有变化。可以试试换个公司。
  • 下一步学什么? 你可以把抓到的数据保存成 CSV 文件,或者用 pandas 做分析。另外,注意抓取频率不要太高,尊重网站的使用条款。

现在你已经迈出了第一步!用同样的思路,你可以抓取任何提供 JSON 接口的网站数据。享受编程的乐趣吧。

内容来源

DEV Tutorial

发布时间

2026-06-03 01:31

返回 AI技术