在前面我们学习http协议的时候,请求体字段中就讲述过cookies字段,这个字段代表用户身份的标识,一般平台通过这个字段存储用户信息,包括并不限于用户名、密码、登陆时间等等。

一般cookies信息都是二值型的,即key=value形式, 非常像字典的构造形式。每一个key=value的信息, 都代表用户的片段信息,很多个key=value片段构成一个完整的cookies字段, 如下图所示:


Python爬虫 requests教学(三):cookies关键字参数_字段


值得注意的是,cookies中所有 片段信息,有浏览器自动生成的,也有服务器在响应数据的时候给你生成的。一旦服务给你生成了cookie片段,那么大概率就会针对这些片段进行校验,验证你的用户身份,从而决定是否返回数据给你。相反来说浏览器自动为我们生成的cookie片段对我们代码请求影响不大,因为服务器往往会校验自己生成的cookie片段,对于浏览器自动生成的cookie片段不会校验。

在requests模块中发送带cookies字段的请求也是比较容易的操作,要实现这个,只需简单地传递一个字典给cookies关键字即可:

cookies ={'key1' :1value1','key2' :value2'}
response =requests . get("url",cooki es=cookies)