基本用法:
import requests req = requests.get("http://www.baidu.com/") //发起GET请求 print(req.text) //打印响应内容
req.ok // 检查返回码是不是 '200 OK',如果是则返回True,否则返回False req.url // 查看请求的URL,也就是'http://www.baidu.com/' req.text // 查看返回的响应内容,返回的是Unicode数据,一般用于返回文本数据 req.content // 查看返回的响应内容,返回的是二进制数据,一般用于返回图片,文件等二进制数据 req.status_code // 查看返回的HTTP状态码,如 200,404,502 等 req.reason // 查看返回的HTTP状态码文本原因,如 'Not Found', 'OK' 等 req.cookies // 查看返回的cookies信息 req.header // 查看返回的头部信息
发起带有参数的GET请求:
import requests params = { "wd": "hello", "rsv_spt": 1 } req = requests.get("http://www.baidu.com/", params=params) //相当于 requests.get("http://www.baidu.com/s?wd=hello&rsv_spt=1") print(req.text)
伪造请求头信息,发起GET请求:
import requests headers = { //定义请求头信息,通常只定义 User-Agent,其他请求头信息可以通过 F12 界面查看 "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.121 Safari/537.36" } req = requests.get("http://www.baidu.com/", headers=headers) print(req.text)