在项目中总是遇到乱码问题,有时候在网上查找到了解决方案,但是没有记录下来为什么出现的乱码。因为出现乱码的方式有好几种,我简单总结一下吧,为以后留着用,也算总结学习一下。 
一般来讲,为了处理乱码问题,在javaweb中我们需要注意哪些地方? 
1、java文件的编码格式 
2、jsp页面的编码格式 
3、在servlet中对request、response对象的编码格式的设定 
4、浏览器中查看页面的字符集编码格式 
前提: 
1.开发和编译代码时指定字符集,JBuilder和Eclipse都可以在项目属性中设置。页面的编码格式一致: 
所有页面的编码格式应该尽量一样,因为有时候在两个页面之间跳转的时候,如果编码格式不一,那么服务器不知道该用哪一种编码格式。 
2.页面编码格式和tomcat配置文件中的编码格式保持一致: 
tomcat/conf/server.xml配置文件中Connector(连接器)标签URIEncoding(统一资源标示符编码)的属性为"GBK"或"UTF-8"。 
3.使用过滤器,如果所有请求都通过一个servlet控制分配器,那么使用servlet的filter的执行语句,将浏览器发送过来的请求都设置编码为utf-8. 
在web.xml文件中: 

<filter>
    <filter-name>SetCharacterEncodingFilter</filter-name>
    <filter-class>com.struts.beans.SetCharacterEncodingFilter</filter-class>
    <init-param>
      <param-name>encoding</param-name>
      <param-value>utf-8</param-value>
    </init-param>
  </filter>
  <filter-mapping>
    <filter-name>SetCharacterEncodingFilter</filter-name>
    <url-pattern>/*</url-pattern>
  </filter-mapping>

在类中: 

public class SetCharacterEncodingFilter implements Filter {
    private String encoding;
public void init(FilterConfig filterConfig) throws ServletException {
        // TODO Auto-generated method stub
        this.encoding = filterConfig.getInitParameter("encoding");
    }
public void doFilter(ServletRequest request, ServletResponse response,
            FilterChain chain) throws IOException, ServletException {

request.setCharacterEncoding(this.encoding);
chain.doFilter(request, response);
}}

4.设定数据库连接方式是utf-8. 
易出现乱码的方式:  
1.通过<a>超链接传递中文乱码。超链接地址栏传参和form表单的get方法,都是以get()方式向服务器提交的数据。这个时候我们会发现地址栏中出现的是中文被编码之后的一串%的东东

<a   href="some.jsp?key=<%=java.net.URLEncoder.encode("可能包含中文的参数","UTF-8")%>">联结</a>

2.通过javascript传递中文乱码 

function getName(){
  var name=jQuery("#name").val();
  name= encodeURI(encodeURI(name));//需要经过两次编码
  window.location.href="user.action?name="+name;
}

在后台Action类中需要解码: 

String name= request.getParameter("name");
try {
    name= URLDecoder.decode(name, "UTF-8"); 
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}

因为iso-8859-1是Java中网络传输使用的标准字符集,request.getParameter("name")得到的还是ISO-8859-1字符集,所以要转换一下才不会是乱码。 
3.通过表单get提交中文乱码 
  第一:先解码然后转码 
  第二:get走的是url提交方式,而在进入url之前已经进行了iso-8859-1的编码。要想影响这个编码可以在server.xml文件中Connector节点中添加userBodyEncodingURI="true",就可以控制tomcat对get方式的汉字编码。 
4.通过表单post提交中文乱码 
第一:其实这也和tomcat的内置编码有关,如果没有设置URIEncoding="UTF-8",那么默认的编码是iso8859-1,需要在servlet中String str=new String(request.getParameter("name").getBytes("ISO-8859-1"),"UTF-8").每一个汉字都需要这样编码,很麻烦。 
第二:设定执行请求编码的格式request.setCharactorEncoding("UTF-8"); 
String str=request.getParameter("name");但是这种方法只针对post提交的参数有效,对于get和上传的方式则是无能为力的。