tomcat默认支持ISO8859-1的编码格式解析,不支持中文,无法解析汉字。

如果要写入汉字,需要重新设置字符集编码为UTF-8的形式。

出现的情况:

  1. Java web下载文件,文件名乱码:浏览器在获取文件名称name时,默认对传过来的参数文件名使用ISO8859-1进行解析,因为这种编码方法不支持中文,所以会出现中文乱码。
  2. servlet跳转出现中文乱码

解决方法:

1、将编码先转成二进制流,再将二进制流转成UTF-8。

//1.将编码转成二进制流。
byte[] bytes = name.getBytes("ISO8859-1");

//2.再使用utf-8编码
name = new String(bytes,"UTF-8");
System.out.println(name);

2、无论是response还是request,都可使用setCharacterEncoding("UTF-8")方法设置。

但是这种方法只适用于post请求方式,如果是get请求方式,就要使用第一种方法。

此方法是先设置缓冲区中使用的编码格式,使之可以写入汉字,再告诉浏览器使用什么方法解析编码,使之显示出来。

//设置缓冲区中使用的编码,使之可以写汉字
response.setCharacterEncoding("UTF-8");
		
//告诉浏览器使用什么方法解析编码
response.setHeader("Content-Type", "text/html;charset=UTF-8");

这两个步骤可以简写为:

response.setContentType("text/html;charset=UTF-8");

此方法内部已经实现了设置缓冲区中使用的编码,所以之前的response.setCharacterEncoding("UTF-8")可以不写。