在请求页面时有时会返回类似:
%E8%AF%A5985%E5%A4%A7%E5%AD%A6%E5%B8%B8%E5%B9%B4%E4%BD%8D%E5%B1%85%E5%9B%BD%E5%86%85%E5%89%8D%E4%BA%
的编码方式,为URL编码,查阅资料后都没有成功转码,原因是 from urllib import parse 导包时提示没有parse这个包,也许是python版本问题,没有深究。
下面是成功的解码和编码方式[quote()和unquote()]:
import urllib
>>> s = '你好'
>>> str1 = urllib.quote(s)
>>> '%E4%BD%A0%E5%A5%BD'
>>> str2 = urllib.unqute(str1)
>>> '你好'