简介:
Cookie,有时也用其复数形式 Cookies,指某些网站为了辨别用户身份、进行 session 跟踪而储存在用户本地终端上的数据。
常见的用途就是保留用户登陆信息,登陆时的7天免登陆,记住我…………这些都是通过cookie实现的。
一:认识cookie
还是firefox,打开百度,登陆一下,shifit+F9,即可弹出存储探查器。看到cookie了吧,百度给你留下的东西还真不少。
chrome快捷键是ctrl+shifit+i
Cookie由变量名和值组成,类似Javascript变量。其属性里既有标准的Cookie变量,也有用户自己创建的变量,属性中变量是用“变量=值”形式来保存。
根据Netscape公司的规定,Cookie格式如下:
Set-Cookie: NAME=VALUE;Expires=DATE;Path=PATH;Domain=DOMAIN_NAME;SECURE
NAME=VALUE
这是每一个Cookie均必须有的部分。NAME是该Cookie的名称,VALUE是该Cookie的值。在字符串“NAME=VALUE”中,不含分号、逗号和空格等字符。
Expires=DATE:Expires变量是一个只写变量,它确定了Cookie有效终止日期。该属性值DATE必须以特定的格式来书写:星期几,DD-MM-YY HH:MM:SS GMT,GMT表示这是格林尼治时间。反之,不以这样的格式来书写,系统将无法识别。该变量可省,如果缺省时,则Cookie的属性值不会保存在用户的硬盘中,而仅仅保存在内存当中,Cookie文件将随着浏览器的关闭而自动消失。
Domain=DOMAIN-NAME:Domain该变量是一个只写变量,它确定了哪些Internet域中的Web服务器可读取浏览器所存取的Cookie,即只有来自这个域的页面才可以使用Cookie中的信息。这项设置是可选的,如果缺省时,设置Cookie的属性值为该Web服务器的域名。
Path=PATH:Path属性定义了Web服务器上哪些路径下的页面可获取服务器设置的Cookie。一般如果用户输入的URL中的路径部分从第一个字符开始包含Path属性所定义的字符串,浏览器就认为通过检查。如果Path属性的值为“/”,则Web服务器上所有的WWW资源均可读取该Cookie。同样该项设置是可选的,如果缺省时,则Path的属性值为Web服务器传给浏览器的资源的路径名。
可以看出我们借助对Domain和Path两个变量的设置,即可有效地控制Cookie文件被访问的范围。
Secure:在Cookie中标记该变量,表明只有当浏览器和Web Server之间的通信协议为加密认证协议时,浏览器才向服务器提交相应的Cookie。当前这种协议只有一种,即为HTTPS。
二:python+selenium 获取cookie
尝试运行下面的代码
from selenium import webdriver
driver=webdriver.Firefox()
driver.get('http://www.baidu.com')
cookie=driver.get_cookies()
print(cookie)
driver.quit()
print('----------')
driver=webdriver.Chrome()
driver.get('http://www.baidu.com')
cookie=driver.get_cookies()
print(cookie)
driver.quit()
输出结果大概是这样的:
firefox
[{'name': 'BAIDUID', 'value': '53****************
chrome
[{'domain': '.baidu.com', 'httpOnly': False, 'name': 'H***********
这是由字典组成的列表,也就是列表的嵌套。
分解看一下:
from selenium import webdriver
driver=webdriver.Firefox()
driver.get('http://www.baidu.com')
cookie=driver.get_cookies()
print('firefox')
print(cookie)
for i in cookie:
for k,v in i.items():
print(k,'-->',v)
print('-------')
driver.quit()
print('-------------------')
driver=webdriver.Chrome()
driver.get('http://www.baidu.com')
cookie=driver.get_cookies()
print('chrome')
print(cookie)
for i in cookie:
for k,v in i.items():
print(k,'-->',v)
print('-------')
driver.quit()
结果比较多,firefox chrome各取一组吧
firefox:
name --> BAIDUID
value --> 77E48BCEEFBD3936310DDD65BF9B2732:FG=1
path --> /
domain --> .baidu.com
expiry --> 3665365219
secure --> False
httpOnly --> False
chrome:
domain --> .baidu.com
expiry --> 1549417579.219434
httpOnly --> False
name --> BAIDUID
path --> /
secure --> False
value --> E5F0899A387E3944B0B8F09D255D9A73:FG=1
虽然顺序不一样,但是结构是一样的。
domain path name value expiry secure httpOnly
三:写入cookie
首先介绍一个web调试网站:http://httpbin.org/
这个网站就是调试web用的,比如说我们现在操作的cookie,和服务器交互等等的原理不考虑,但是我们和服务器交互的内容怎么看呢?
这个网站就提供了显示交互内容的功能,不仅有cookie,还有ip user-agent headers …………
现在我们看一下cookies http://httpbin.org/cookies
cookies是空的。
我们尝试一下写个cookie进去。
"""
Adds a cookie to your current session.
:Args:
- cookie_dict: A dictionary object, with required keys - "name" and "value";
optional keys - "path", "domain", "secure", "expiry"
Usage:
driver.add_cookie({'name' : 'foo', 'value' : 'bar'})
driver.add_cookie({'name' : 'foo', 'value' : 'bar', 'path' : '/'})
driver.add_cookie({'name' : 'foo', 'value' : 'bar', 'path' : '/', 'secure':True})
"""
from time import sleep
from selenium import webdriver
driver = webdriver.Firefox()
driver.get('http://httpbin.org/cookies')
print(driver.get_cookies())
c1 = {
'name':'username',
'value':'jackadam',
# 'path':'/',
# 'domain':'httpbin.org',
# 'secure':False,
# 'expiry':None,
}
driver.add_cookie(c1)
print(driver.get_cookies())
sleep(3)
driver.refresh()
sleep(3)
driver.quit()
首先访问http://httpbin.org/cookies,然后增加一条cookie,等3秒后刷新,再等3秒,关闭浏览器。
官方文档写的,必选项name value,可选项path domain secure expiry
所以,注释掉的可选项,你也可以加上去。
注意:要首先打开这个网站,才可以给这个网站增加cookie。或许可以通过profile方式,先加载cookie再打开网站(研究中)