禁忌toString(),getBytes(),new String().
通常遇到字符乱码时,每个人都会说,我这里是好好的,不信你看。但是,请你相信,也许问题就出在你认为对的地方。项目是一个整体,如果你不遵守项目组制定的规范,那么在你的模块里再好也是徒劳无益的。所以在使用toString(),getBytes(),new String()这些函数时,请一定设定它们的编码格式,比如getBytes(”UTF-8″),toString(”UTF-8″),如果缺省,系统会采用java默认的编码格式,这往往就为你的团队埋下了苦果。
真的,有时候你得到的字符串明明是utf-8的,但是打印出来就是乱码,好吧我不知道这是为什么,但你可以试一下htmlStr=new String(htmlStr.getBytes(”UTF-8″),”UTF-8″);也许问题就会解决。
总之,解决java中文乱码是一个细活,规范的开发手册+良好的编程习惯+细心也许会让你不至于有些时候手忙脚乱。
个人签名
-------------------------------------