python 设置编码 python的编码

转载

mob6454cc6aab12 2023-07-06 22:17:26

文章标签 python 编码风格 python 字符串乱码编码方式 文章分类 Python 后端开发

前言

以下内容来自网上&个人总结，如果有什么地方错误或者表达不准确欢迎指正。

三种编码

在python从文件到运行，总计能遇到三种编码。

首先，.py文件有自己的编码方式，也就是这个文件是以什么编码方式保存在本地的。在windows下，python2默认是ASCII，python3默认是utf-8，这个可以用以下代码查看。

import sys
print(sys.getdefaultencoding())

其次，.py在编译时要按计算机本身用的编码来编译，大部分的中文语言的计算机应该都是GB2312，这个编码方式可以在文件开头用

#coding = utf-8

这种方式来改变，只有这个编码和上面的文件编码一致时才不会导致乱码问题。

最后，print这个函数有自己的编码方式，它与stdout的编码方式是一致的，具体请看参考文献[2]，如果这个编码不一致的话，有可能会导致无法输出想要的东西

字符串编码

见下图

python 设置编码 python的编码_python

在python2中，字符串有str和unicode两种形式(这两种的区分并不明显，有时会引起混淆)，而在python3中，变成了byte和str，这就导致了很多代码在其中一个python版本中能跑，但是在另一个版本就会报错，就是可能因为在python2中一个变量是str格式的，到python3后变成bytes格式了，然后函数就不认了，这时有两种处理方式：