除一提到之外,urllib中还有一些常见的用法

如果希望返回与当前环境有关的信息,我们可以用info()返回,格式为“爬取的网页.info()”,爬取的网页赋值为file

file.info()

如果希望获取当前爬取网页的状态码,我们可以使用getcode(),格式为“爬取的网页.getcode()”,爬取的网页赋值为file

file.getcode()

如果想要获得当前爬取的url地址,我们可以使用geturl()来实现,格式为“爬取的网页.geturl()”,爬取的网页赋值为file

file.geturl()

如果要进行编码解码,我们可以使用urllib.request.quote(),比如

urllib.request.quote("http://www.baidu.com")#编码
urllib.request.unquote("http://www.baidu.com")#解码