python写入文件后中文乱码

原创

樱桃小文子 2023-06-19 17:58:45 博主文章分类：Python ©著作权

文章标签 html 写入文件中文乱码 Python 解码编码 文章分类 软件测试 技术人为什么要写博客？

©著作权归作者所有：来自51CTO博客作者樱桃小文子的原创作品，请联系作者获取转载授权，否则将追究法律责任

🎈问题描述

有问题的代码：

from urllib.request import urlopen

url = "http://www.baidu.com"
resp = urlopen(url)

resp_1 = resp.read().decode("UTF-8")

with open("mybaidu.html", mode="w") as f:
    f.write(resp_1)
print("over!")

问题代码运行后，文件中的内容：

python写入文件后中文乱码_Python

运行乱码的mybaidu.html，如图：

python写入文件后中文乱码_中文乱码_02

🎈解决方法

关键点①：确定是哪一步导致了问题
关键点②：修改Python打开文件的编码（encoding="utf-8"）

正确的代码：

from urllib.request import urlopen

url = "http://www.baidu.com"
resp = urlopen(url)

resp_1 = resp.read().decode("UTF-8")

with open("mybaidu.html", mode="w", encoding="utf-8") as f:
    f.write(resp_1)
print("over!")