读取xm了,html等如果编码不正确,会报一种非常奇异的异常

前言中不允许有内容

出现这种问题的原因,就是因为html或者xml或者其他要读取的文件的编码问题,是不是utf-8带签名

前言中不允许有内容 问题解决_html


UTF-8 BOM中的BOM,全称为Byte order mark。

带BOM(签名)的UTF-8文本文件与不带BOM的UTF-8文本文件的区别在于:前者在文件的开头有3个字节 EF BB BF

在windows平台上,默认的utf-8格式文本都是带BOM的,并且文本编辑器都能识别BOM;而在其他的平台,比如Linux下的文本处理器很可能是不识别BOM的,会导致文件的第一行读不出来。而一般上认为不带BOM的utf-8格式是标准格式。

前言中不允许有内容 问题解决_jar_02


遇到这种问题,可以将编码调整为UTF-8编码,不带BOM即可。