分页爬取思路

46.8 分页爬取思路

列表页 URL 常有 ?page=1,2,3… 或 /list/1/;循环构造 URL 逐页抓取。

终止条件:无数据、重复、超过最大页。

循环分页

# ========================================
# 示例:分页 URL 模式
# ========================================
import requests

for page in range(1, 4):
    url = f'https://httpbin.org/get?page={page}'
    r = requests.get(url, timeout=10)
    print('第', page, '页', r.json()['args'])