一、编码/解码简析

  首先,明确一点,计算机中信息储存都是以二进制方式进行的。编码:将字符串转byte;解码:将byte转字符串。编码和解码本质上是一种映射(对应关系),比如“a”用ASCLL编码则为65,计算机中储存的就是00110101,但是,显示的时候不能显示00110101,还是要显示“a”,计算机怎么知道00110101是“a”呢,这就需要解码,当选择用ASCLL解码时,当计算机读到00110101时就到对应的ASCLL表里面一查发现“a”,就显示“a”。

二、常见的编码格式分类

  编码格式大致有这几类:Unicode、ASCLL、GBK、GB2312、UTF-8,Python中最常用的编码为UTF-8格式。

三、编码/解码示例

  Python内建函数中,用于编码的为 encode()函数,用于解码的为decode()函数。

str = "佩琪是一只猪!"

# 编码:字符串转byte
str_bm = str.encode("utf-8")    # 以utf-8的格式,将字符串转换成字节码

# 解码:byte转字符串
byte_jm = str_bm.decode("utf-8")

print(str_bm)
print(byte_jm)


>>b'\xe4\xbd\xa9\xe7\x90\xaa\xe6\x98\xaf\xe4\xb8\x80\xe5\x8f\xaa\xe7\x8c\xaa\xef\xbc\x81'
>>佩琪是一只猪!