最近在学习爬虫,但是关于解码和编码的问题上出现了一些问题,百度了一下,终于找到了问题的解决办法

爬取网页时,自己用的明明是utf-8的编码(第一行的注释为utf-8,编码中的编码格式也是utf-8),但是还是报gbk的错误,找了半天发现不是编码的问题,而是print的问题,因为pycharm自带的编码是gbk的,而输出的utf-8,难免就会出错了,所以要将默认的编码格式改为utf-8的

Python问题3——爬虫编码问题_开发语言

只需要进行如下设置:

①在file中选择settings 

Python问题3——爬虫编码问题_开发语言_02

②然后再editor下的file encoding中,将两个编码格式均设置为utf-8的形式即可

Python问题3——爬虫编码问题_创建文件_03

 补充:设置默认模块注释(第一行的代码注释不用一直输入,每次创建文件自动写入)

Python问题3——爬虫编码问题_开发语言_04

Python问题3——爬虫编码问题_开发语言_05