java中文乱码强转 java怎么把乱码转成中文

转载

在java开发的时候总会遇到java中文乱码的情况，汉字编码怎样才能正确的选择以及如何正确处理汉字的编码，接下来我通过自己的java经验来告知大家应对java中文乱码的妙招。

　　第一，要想解决java中文乱码问题就有必要了解一下什么是字符，字符集，编码的概念。

　　字符：是文字与符号的总称，包括文字、图形符号、数学符号等。

　　字符集：就是一组抽象字符的集合。字符集常常和一种具体的语言文字对应起来，该文字中的所有字符或者大部分常用字符就构成了该文字的字符集，比如英文字符集。繁体汉字字符集、日文汉字字符集等等。

　　计算机要处理各种字符，就需要将字符和二进制内码对应起来，这种对应关系就是字符编码：制定编码首先要确定字符集，并将字符集内的字符排序，然后和二进制数字对应起来。根据字符集内字符的多少，会确定用几个字节来编码。

　　每种编码都限定了一个明确的字符集合，叫做被编码过的字符集(Coded Character Set)，这是字符集的另外一个含义。通常所说的字符集大多是这个含义。

　　第二，要想解决java中文乱码问题也得了解一下我们常用的编码方式：

　　ASCII编码是目前计算机中用得最广泛的字符集及其编码。

　　ISO8859-1可以表示的是西欧语言。看起来很单一为什么还在使用呢？，由于是单字节编码，和计算机最基础的表示单位一致，所以很多时候，仍旧使用ISO-8859-1编码来表示。而且在很多协议上，默认使用该编码。

　　Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。通常海浪所遇到过多UTF-8这是Unicode编码的实现方式，请一定要加以区分。

　　GB2312字集是简体字集;BIG5字集是台湾繁体字集;GBK字集是简繁字集，包括了GB字集、BIG5字集和一些符号

　　GB18030是国家制定的一个强制性大字集标准，它的推出使汉字集有了一个统一的标准。

　　Linux系统默认使用的是ISO-8859-1编码，Win32系统默认使用的是GB2312编码。

　　第三，了解乱码是怎么产生的，如何解决java中文乱码？

　　字符在保存时的编码格式如果和要显示的编码格式不一样的话，就会出现乱码问题。海浪在做开发的时候，提倡开发环境编码一致。如页面编码，数据库编码等。

　　Java在运行期一律以Unicode来存储字符,这样有利的支持了多语言环境。海浪在开发过程中经常会用到文件读取。Java读文件的时候会用到系统默认的编码来解码文件。所以在用FileInputStream类读取文件可以指定编码读取。

　　JSP页面乱码通常只要在页面开始地方用下面代码指定字符集编码即可。如果还不行，那么请用下面这句话来转换 str=new String(str.getBytes("ISO-8859-1"),"页面编码方式");

　　JAVA在网络传输中使用的编码是"ISO-8859-1"，故在输出时需要进行转化，如：

　　String str=new String(str.getBytes("开发环境编码"),"ISO-8859-1");

　　经过网络编码后的中文，要正确显示在页面上必须要用类似于

　　Stirng str=new String(str.getBytes("ISO-8859-1"),"开发环境编码");这样的方式来解码

　　第四,为了避免不必要的java中文乱码，我们首先要从源头做起。

　　什么意思呢？这就是说，我们在项目开发中，首先要让我们开发环境统一编码。比如我用的开发环境是Eclipse+Tomcat5.0+SQLServer 2005。Eclipse的项目属性中可以设置项目的编码，可以针对JSP页面的设置统一的编码。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

51CTO博客