Python写UTF8文件,UE、记事本打开依然乱码的问题

​Leave a reply​

现象:使用codecs打开文件,写入UTF-8文本,正常无错误。用vim打开正常,但记事本、UE等打开乱码。

原因:一般写文本时,默认是没有BOM头的,即编辑器不知道这个文本文件是神马编码,只能智能detect,这个detect有的弱有的强,比如UE、记事本就挂了,认为是ASCII格式的,于是就乱码了。

解决方法:如果为了编辑器打开正常,可以加入BOM编码。但一定要慎重,一旦加入后,头部会增加2~3个字节,如果程序再读取,显然会出错。这个如果使用UE编辑过PHP代码抓过狂的都应该懂得,NOBOM哦亲~

http://www.coder4.com/archives/3835">​?​​ # 四号程序员 http://www.coder4.com

1234

​fp_out ​​​​=​​​​codecs.​​​​open​​​​(fn_out, ​​​​"w"​​​​, ​​​​"utf-8"​​​​)​​​​fp_out.write(codecs.BOM_UTF8.decode(​​​​"utf-8"​​​​))​​​​....​​​​fp_out.close()​


注意上述codecs.BOM_UTF是个常量,Python中预定义的还有:

http://www.coder4.com/archives/3835">​?​​ # 四号程序员 http://www.coder4.com

01020304050607080910

​codecs.BOM ​​​​codecs.BOM_BE ​​​​codecs.BOM_LE ​​​​codecs.BOM_UTF8 ​​​​codecs.BOM_UTF16 ​​​​codecs.BOM_UTF16_BE ​​​​codecs.BOM_UTF16_LE ​​​​codecs.BOM_UTF32 ​​​​codecs.BOM_UTF32_BE ​​​​codecs.BOM_UTF32_LE​