【写在前面】其实导出这个功能在业务需求中是很多的,今天我就先不重点介绍导出实现过程,主要给大家讲解一下导出文件时候,文件名是中文的情况下会出现乱码、下划线等现象该如何去解决,如何理性分析。
涉及知识点:java文件导出,中文名乱码,URLEncoder,java下载乱码,java导出中文名百分号字符串
目录
- 问题复现
- 中文名乱码
- 中文名下划线
- 百分号串(%EB%S7%.xlsx)
- 中文名正常的模式
- 1、下载异常现象原因
- 1.1 下划线原因
- 1.2 乱码原因
- 1.3 %百分号串原因
- 2、解决乱码方式
- 2.1 源码实现
- 2.2 源码分析
- Content-disposition应用
- URLEncoder.encode应用
- utf-8及ISO-8859-1应用(乱码的祸源)
- 3、彩蛋上皇榜
问题复现
中文名乱码
中文名下划线
百分号串(%EB%S7%.xlsx)
中文名正常的模式
1、下载异常现象原因
1.1 下划线原因
没有做任何处理,直接将中文名塞到header里面,错误的代码如下:
response.setHeader("Content-disposition","attachment; filename=黄大大的街舞梦.xlsx");
response.setContentType("application/vnd.ms-excel");
response.setCharacterEncoding("UTF-8");
1.2 乱码原因
因为错乱使用转义,有些人经常会说用utf-8的ISO-8859-1方式,其实也没有错,但是这个之前应该要做一个encode操作
错误代码如下:
fileName = new String("黄大大的街舞梦.xlsx".getBytes("utf-8"),"ISO-8859-1");
response.setHeader("Content-disposition","attachment; filename="+ fileName);
response.setContentType("application/vnd.ms-excel");
response.setCharacterEncoding("UTF-8");
1.3 %百分号串原因
因为后端使用了encode进行中文转码,但是前端下载接收的时候没有用decode进行解码的操作。
这个主要是前端的问题。
2、解决乱码方式
2.1 源码实现
其实在上面的1.2就很接近正确的模式了,只是针对中文名缺少一个encode的方式,如下所示正确实现代码如下:
fileName = URLEncoder.encode("黄大大的街舞梦.xlsx", "UTF-8");
response.setHeader("Content-disposition","attachment; filename="+ fileName);
response.setContentType("application/vnd.ms-excel");
response.setCharacterEncoding("UTF-8");
所以说问题的核心在于没有对中文进行一个URLEncoder.encode的处理,具体效果如一开始效果图。完整实现导出的文章将在下一篇详解。
2.2 源码分析
可能到这里确实解决了大家的问题,但是呢我们对上面写的东西又了解多少呢?
首先是Content-disposition是啥?其次URLEncoder.encode又是啥,还有utf-8及ISO-8859-1又是啥,我们为啥要从这些方向设置入手?下面请听我一一介绍。
Content-disposition应用
这个是MIME协议的一种扩展,主要目的就是显示待下载的文件,当浏览器接收到请求头后,就会去激活一个下载框,他们的名字需要自己塞值到header里面,从而我们下载的文件名要放这个里面。没有设置它就根本不能触发浏览器下载的那个动作。
URLEncoder.encode应用
URLEncoder.encode后其中fileName如下所示是带有%字母加数字的组合编码形式,其实这个你就可以这么去理解,后端采用这种编码格式,机器能识别,也能塞到头里面有助于传输,但是切记前端收到的时候用decodeURI进行解密哟,不然下载下来的是%E9%BB%之类的乱串。
utf-8及ISO-8859-1应用(乱码的祸源)
utf-8及ISO-8859-1使用前后的区别相信大家一目了然了。
所以说在使用的过程中我们一定不要盲目相信网上的那些抄袭的文章,毕竟实践出真知,我也是自己实践过才敢发布文章的,希望能够得到大家的支持。最终效果: