python str 编码 python str.decode

转载

mob6454cc76bc4a 2023-05-27 19:50:05

一.几个特别容易混淆和弄不清的概念

在python中，编码解码其实是不同编码系统间的转换，默认情况下，转换目标是Unicode，即编码unicode→str，解码str→unicode，其中str指的是字节流，而str.decode是将字节流str按给定的解码方式解码，并转换成utf-8形式，u.encode是将unicode类按给定的编码方式转换成字节流str。

1.对于字符的编码解码

普通字符串，unicode字符串，以指定方式编码的字符序列。

2.对于文件的编码解码

文件的编码就是文件所存储字符串的编码方式

3.python代码第一行的# -*- coding:utf-8 -*-

4.sys.setdefaultencoding

二.常见错误类型

当我调用str1.decode('utf-8')的时候

return codecs.utf_8_decode(input, errors, True)
UnicodeDecodeError: 'utf8' codec can't decode byte 0xc4 in position 0: invalid continuation byte

三.常见使用方式

1.将unicode字符转成utf-8编码的序列

>>> u'你好'.encode('utf-8')
'\xe4\xbd\xa0\xe5\xa5\xbd'

2.将unicode字符转化成gbk编码的序列

>>> u'你好'.encode('gbk')
'\xc4\xe3\xba\xc3'

3.将字符串转化成unicode字符

首先我们无法得知给定的一个字符串是以什么方式编码的。

我们猜测是utf-8编码的，就以utf-8来进行解码 str2.decode('utf-8')，从而得到unicode

若我们猜测是gbk编码的，就以gbk来进行解码，str3.decode('gbk')，从而得到unicode

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：python中time() Python中time模块

下一篇：python time out pythontimeout方法

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

python str 编码 python str.decode

python str 编码 python str.decode

一.几个特别容易混淆和弄不清的概念

1.对于字符的编码解码

2.对于文件的编码解码

文件的编码就是文件所存储字符串的编码方式

4.sys.setdefaultencoding

二.常见错误类型

三.常见使用方式

1.将unicode字符转成utf-8编码的序列

2.将unicode字符转化成gbk编码的序列

3.将字符串转化成unicode字符

51CTO博客