一、编码/解码简析
首先,明确一点,计算机中信息储存都是以二进制方式进行的。编码:将字符串转byte;解码:将byte转字符串。编码和解码本质上是一种映射(对应关系),比如“a”用ASCLL编码则为65,计算机中储存的就是00110101,但是,显示的时候不能显示00110101,还是要显示“a”,计算机怎么知道00110101是“a”呢,这就需要解码,当选择用ASCLL解码时,当计算机读到00110101时就到对应的ASCLL表里面一查发现“a”,就显示“a”。
二、常见的编码格式分类
编码格式大致有这几类:Unicode、ASCLL、GBK、GB2312、UTF-8,Python中最常用的编码为UTF-8格式。
三、编码/解码示例
Python内建函数中,用于编码的为 encode()函数,用于解码的为decode()函数。
str = "佩琪是一只猪!" # 编码:字符串转byte str_bm = str.encode("utf-8") # 以utf-8的格式,将字符串转换成字节码 # 解码:byte转字符串 byte_jm = str_bm.decode("utf-8") print(str_bm) print(byte_jm) >>b'\xe4\xbd\xa9\xe7\x90\xaa\xe6\x98\xaf\xe4\xb8\x80\xe5\x8f\xaa\xe7\x8c\xaa\xef\xbc\x81' >>佩琪是一只猪!