1. 在window中运行python程序的时候出现下面报错信息:但是在linux系统下程序正常运行,说明一定是程序编码出现问题。

open(file_)
UnicodeDecodeError: 'gbk' codec can't decode byte 0xaf in position 1482: illegal multibyte sequence

2.一些修改的尝试

然后在pycharm设置为utf-8编码没有卵用:

Python 打开文件 invalid argument python 打开文件编码报错_linux

 查看window系统下的编码格式,直接输入chcp:

Python 打开文件 invalid argument python 打开文件编码报错_重启_02

早期IBM和微软内部使用特别数字来标记这些编码,其实大多的这些编码已经有自己的名称了。虽然图形操作系统可以支持很多编码,很多微软程序还使用这些数字来点名某编码。

下表列出了所有支持的代码页及其国家(地区)或者语言: 
代码页       国家(地区)或语言 
437          美国 
708          阿拉伯文(ASMO 708)
720          阿拉伯文(DOS)
850          多语言(拉丁文 I) 
852          中欧(DOS) - 斯拉夫语(拉丁文 II) 
855          西里尔文(俄语) 
857          土耳其语 
860          葡萄牙语 
861          冰岛语 
862          希伯来文(DOS)
863          加拿大 - 法语 
865          日耳曼语 
866          俄语 - 西里尔文(DOS) 
869          现代希腊语
874          泰文(Windows)
932          日文(Shift-JIS)
936          中国 - 简体中文(GB2312)
949          韩文
950          繁体中文(Big5)
1200         Unicode        
1201         Unicode (Big-Endian)
1250         中欧(Windows)
1251         西里尔文(Windows)
1252         西欧(Windows)
1253         希腊文(Windows)
1254         土耳其文(Windows)
1255         希伯来文(Windows)
1256         阿拉伯文(Windows)
1257         波罗的海文(Windows)
1258         越南文(Windows)
20866        西里尔文(KOI8-R)
21866        西里尔文(KOI8-U)
28592        中欧(ISO)
28593        拉丁文 3 (ISO)
28594        波罗的海文(ISO)
28595        西里尔文(ISO)
28596        阿拉伯文(ISO)
28597        希腊文(ISO)
28598        希伯来文(ISO-Visual)
38598        希伯来文(ISO-Logical)
50000        用户定义的
50001        自动选择
50220        日文(JIS)
50221        日文(JIS-允许一个字节的片假名)
50222        日文(JIS-允许一个字节的片假名 - SO/SI)
50225        韩文(ISO)
50932        日文(自动选择)
50949        韩文(自动选择)
51932        日文(EUC)
51949        韩文(EUC)
52936        简体中文(HZ)
65000        Unicode (UTF-7)
65001        Unicode (UTF-8)

说明果然是window系统默认编码为GB2312的原因。说明:pycharm运行程序时open函数可能不是根据软件的设置就能改变的,而是根据系统内部的编码,在系统终端输出936也证明了这一点。

因此尝试通过注册表来更改系统的默认编码为utf-8。

进入控制台或者win+R输入regedit进入注册表界面。

  1. 按顺序找到HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Command Processor。
  2. 点击右键-新建,选择“字符串值”。
  3. 命名为“autorun”, 点击右击修改,数值数据填写“chcp 65001”,确定。
  4. 这时候打开cmd命令窗口就会看到,和之前临时修改的窗口一样,编码已经修改成UTF-8了,而且每次打开cmd都是UTF-8编码。

以上修改注册表后好像没有什么卵用,只是修改每次进入CMD的时候,针对终端变成了utf-8的编码了。使用pycharm运行python程序读文件依然是报错。(说明修改注册表仅仅是针对终端并没有修改系统内部)。删除刚刚添加的autorun注册表内容。验证是否删除成功,重新打开终端,输入chcp。

3.下面开始修改系统的utf-8编码格式

打开注册面板搜索区域:

Python 打开文件 invalid argument python 打开文件编码报错_Windows_03

 按顺序输入或点击如下内容。然后第6步会提示是否重启(开始我点稍后重新,重启后没有更新,之后开机重新操点立即重启然后才更新成功,不知道是不是系统bug)

Python 打开文件 invalid argument python 打开文件编码报错_Windows_04

 验证是否修改成功。打开终端输入chcp出现下面表示成功了!!!

Python 打开文件 invalid argument python 打开文件编码报错_重启_05

这时再运行pycharm中的open(文件)程序就不会编码错误的报错了。

不确定之前配置的pycharm软件中的utf-8格式取消会不会影响,还是保留pycharm这样的设置吧。

Python 打开文件 invalid argument python 打开文件编码报错_ico_06

当然,也可以通过open(“txt文件”,encoding="utf-8")指定编码读取,这样程序也能运行,但是如果程序中出现的读文件操作很多,改起来就有点麻烦了。