Servlet 输出中文乱码的新收获(1)

关注 nanhaochen

Servlet 输出中文乱码的新收获(1)

精选转载

nanhaochen 2007-10-21 19:37:15

文章标签 职场 Servlet 中文乱码休闲 文章分类 Java 后端开发

又碰到servlet 输出中文乱码的问题，恼火。研究了一下，有了新的发现和认识。

原始代码：

java 代码

protected void doGet(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {
PrintWriter pw = response.getWriter();
response.setCharacterEncoding("utf-8");
response.setContentType("text/html; charset=utf-8");
pw.print("中文");
}

无论把3、4两句改成gbk还是utf-8，页面访问到的一律是??

一怒之下用wpe抓包，发现无论设为utf-8还是gbk抓到的均为

HTTP 代码

HTTP/1.1 200 OK
Server: Apache-Coyote/1.1
Content-Type: text/html;charset=ISO-8859-1
Content-Length: 2
Date: Thu, 08 Mar 2007 06:04:55 GMT
??

说明3、4两句没起作用，检查代码，尝试把2和三四顺序调整，乱码问题解决。

检查api文档，发现说明如下

PrintWriter getWriter() throws IOException

Returns a PrintWriter object that can send character text to the client. The PrintWriter uses the character encoding returned by getCharacterEncoding(). If the response's character encoding has not been specified as described in getCharacterEncoding (i.e., the method just returns the default value ISO-8859-1), getWriter updates it to ISO-8859-1.

推断getWriter()返回的PrintWriter使用的charactor encoding是在这个函数返回时即已确定的，但到底是返回的PrintWriter内部属性还是运行时的控制，未找到依据。

查看 tomcat中setCharacterEncoding方法的实现时发现如下代码：

java 代码

public void setCharacterEncoding(String charset) {
if (isCommitted())
return;
// Ignore any call from an included servlet
if (included)
return;
// Ignore any call made after the getWriter has been invoked
// The default should be used
if (usingWriter)
return;
coyoteResponse.setCharacterEncoding(charset);
isCharacterEncodingSet = true;
}

其中usingWriter 标志为getPrinteWriter方法中设定，可见其控制逻辑为一旦返回了PrintWriter，本函数即不再生效。但是上述的推断没有进一步的证据。

同时我们发现只有usingWriter标志，却没有usingOutputStream标记。猜测使用ServletOutputStream 输出不受此限制，经测试写出如下代码。

java 代码

ServletOutputStream out = response.getOutputStream();
out.print("中文");
//情况1：正常，浏览器按utf-8方式查看
//response.setContentType("text/html; charset=utf-8");
//情况2：浏览器缺省按简体中文查看，手动设为utf-8方式查看正常
//response.setCharacterEncoding("utf-8");

说明：这种方式不仅不需要在调用getOutputStream()之前设定字符集，甚至在print输出后设定都有效。

（居然有字数限制，并且提示都没有，内容就丢了，郁闷。只好分两篇了，待续）

赞
收藏
评论
分享
举报

上一篇：Web定时器 - Timer

下一篇：Servlet 输出中文乱码的新收获(2)

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费资料
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册