python 在处理网页的时候通常需要自己构造url,如在浏览器中显示为
实际浏览器载入的url是:
http://search.jd.com/Search?keyword=%E7%A7%BB%E5%8A%A8%E5%B8%A6%E5%BC%8F%E8%BE%93%E9%80%81%E6%9C%BA&enc=utf-8&book=y
这里涉及到url编码中文的问题
需要把中文转换为url编码,具体用到python urllib或者urllib2库,一下用urllib2实例
isn=raw_input('请输入关键字')
isn1=urllib2.quote(isn.decode(sys.stdin.encoding).encode('utf8'))
url='http://search.jd.com/Search?keyword='+isn1+'&enc=utf-8&suggest=0&book=y'
具体红色部分用什么编码方式的具体分析,像京东的是utf8方式从url中也可以体现出来。百度的是gbk,其他的一般网站比如google就是utf8的。
参考链接:http://developer.51cto.com/art/201003/190800.htm