Servlet接收JSP参数乱码问题解决办法
 
环境:
apache-tomcat-6.0.24.zip
jdk1.6.0_16
WindosXP 简体中文版
Netbeans6.8
 
目标:
解决Servlet接收到JSP传递的参数后乱码问题,乱码发生在Servlet一方。
 
JSP向Serlvet传递参数有两种方式,一种是GET方式,另一种是POST方式,为了解决乱码问题,必须对这两种方式工作原理有个深刻理解才行。
 
这里先写一个简单的JSP(工程所有的源代码文件编码均为GBK),里面有两种提交参数的方式:
<%@page contentType="text/html" pageEncoding="GBK"%>
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"
     "http://www.w3.org/TR/html4/loose.dtd">

<html>
        <head>
                <meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
                <title>JSP Page</title>
        </head>
        <body>
                <h1>页面提交中文测试!</h1>
                <h2>GET方式</h2>
                <a href="/testweb/TestServlet?param=中文">GET方式提交中文测试</a>
                <h2>POST方式</h2>
                <form action="/testweb/TestServlet" method="post">
                        <input type="text" name="param" value="中文"/>
                        <button type="submit" name="提交中文参数测试" value="提交中文参数测试"/>
                </form>
        </body>
</html>
 
然后定义一个Servlet接收提交的参数。
 
这里强调一点,在此使用的tomcat没有经过任何的修改与配置。
当页面通过两种方式请求Servlet的时候,参数的编码原本为GBK,在通过HTTP服务将请求发送出去的时候,会将参数重新按照ISO-8859-1编码后发送。因此,不管GET或POST方式,Servlet接收到的参数数据的编码均为ISO-8859-1,必须重新转码为GBK,才能正确显示中文参数。
 
 
1、GET方式的请求与接收过程
页面中参数“param=中文”的编码原本为GBK,当用GET方式发送参数的时候,参数值会被Web服务器从GBK转码为ISO-8859-1。
Servlet接收到的GET请求参数的编码当然为ISO-8859-1了,对于中文肯定显示不了,因此要将ISO-8859-1转换为GBK就可以正常显示中文了。
                String param = request.getParameter("param");
                String x = new String(param.getBytes("ISO-8859-1"), "GBK");
                System.out.println("GET方式获取的中文参数值:" + x);
 
 
2、POST方式请求与接收过程
页面中参数“param=中文”的编码原本为GBK,当点击页面中提交按钮后,参数会以GBK编码格式发送给Servlet,因此Servlet接收参数的时候必须将请求的编码明确设定为GBK,这样才能正确接收中文。
                request.setCharacterEncoding("GBK");
                String param = request.getParameter("param");
                System.out.println("POST方式获取的中文参数值:" + param);
 
或者,可以按照get方式来接收post的参数:
                String param = request.getParameter("param");
                String x = new String(param.getBytes("ISO-8859-1"), "GBK");
                System.out.println("GET方式获取的中文参数值:" + x);
 
 
疑问:为什么在GET方式下不设定请求的编码格式呢?原因是GET方式使用的编码为ISO-8859-1,用GBK、UTF-8等接收效果都是一样的(都是一堆字母和符号),编不编都一个样,如果指定ISO-8859-1编码是多一翻手续,如果指定了非ISO-8859-1编码,是脑子还不清醒,没搞明白这个原理,因此,GET方式就不要指定请求的编码了。
 
下面看看Servlet的写法:
package jweb.lavasoft;

import java.io.IOException;
import java.io.PrintWriter;
import javax.servlet.ServletException;
import javax.servlet.http.HttpServlet;
import javax.servlet.http.HttpServletRequest;
import javax.servlet.http.HttpServletResponse;

public class DealPageParamServlet extends HttpServlet {

        protected void doGet(HttpServletRequest request, HttpServletResponse response)
                        throws ServletException, IOException {
                String param = request.getParameter("param");
                String x = new String(param.getBytes("ISO-8859-1"), "GBK");
                System.out.println("GET方式获取的中文参数值:" + x);
        }

        protected void doPost(HttpServletRequest request, HttpServletResponse response)
                        throws ServletException, IOException {
                request.setCharacterEncoding("GBK");
                String param = request.getParameter("param");
                System.out.println("POST方式获取的中文参数值:" + param);
        }
}
 
其实,只要搞明白了编码过程,遇到乱码问题就能从容应对了。
常常见到有人遇到乱码了,就开始修改Tocmat的server.xml的配置文件,或者添加过滤器等等,糊里糊涂搞,大多数情况问题都能解决掉,其实也仅仅是个瞎猫逮住个死耗子。