下载网页
46.3 下载网页
requests.get 获取 HTML;检查 status_code;设置 timeout 和 headers。
获取页面源码
# ========================================
# 示例:下载 HTML
# ========================================
import requests
headers = {'User-Agent': 'PythonLearnBot/1.0'}
r = requests.get('https://httpbin.org/html', headers=headers, timeout=10)
r.raise_for_status()
print('长度', len(r.text), '字符')