举个例子
>>> s = u'\u6ce8\u91ca'
>>> s
u'\u6ce8\u91ca'
>>> print s
注释
>>> print type(s)
<type 'unicode'>
>>> print s.encode('gbk')
注释
字符串前加u表示为unicode编码,而当前文本的unicode编码 可以设定,
比如utf-8编码就是第一行加上:
# -*- coding: utf-8 -*-
而gbk编码为
# -*- coding: gbk -*-
参考
python中文编码
详细的python编码内容
如例子
"我是中文".decode("GBK").encode("GBK")
#输出‘\xce\xd2\xca\xc7\xd6\xd0\xce\xc4′
可以参考
http://www.crifan.com/python_already_got_correct_encoding_string_but_seems_print_messy_code/