java 配置Apache,Tomcat的gzip压缩功能
HTTP 压缩可以大大提高浏览网站的速度,它的原理是,在客户端请求网页后,从服务器端将网页文件压缩,再下载到客户端,由客户端的浏览器负责解 压缩并浏览。相对于普通的浏览过程HTML ,CSS,Javascript , Text ,它可以节省40%左右的流量。更为重要的是,它可以对动态生成的,包括CGI、PHP , JSP , ASP , Servlet,SHTML等输出的网页也能进行压缩,压缩效率惊人
一对于Tomcat5.0以后的版本是支持对输出内容进行压缩的. 使用的是gzip压缩格式
下 面是tomcat5.5.20 中的$tomcat_home$/conf/server.xml的原内容
1
<
Connector
port
="80"
maxHttpHeaderSize
="8192"
2
maxThreads
="150"
minSpareThreads
="25"
maxSpareThreads
="75"
3
enableLookups
="false"
redirectPort
="8443"
acceptCount
="100"
4
connectionTimeout
="20000"
disableUploadTimeout
="true"
URIEncoding
="utf-8"
/>
5
<!--
Note : To disable connection timeouts, set connectionTimeout value
6
to 0
-->
7
8
<!--
Note : To use gzip compression you could set the following properties :
9
10
compression="on"
11
compressionMinSize="2048"
12
noCompressionUserAgents="gozilla, traviata"
13
compressableMimeType="text/html,text/xml"
14
-->
从上面的 第 8行
内容可以看出,要使用gzip压缩功能,你可以在Connector实例中加上如下 属性即可
1) compression="on" 打开压缩功能
2) compressionMinSize="2048" 启用压缩的输出内容大小,这里面默认为2KB
3) noCompressionUserAgents="gozilla, traviata" 对于以下的浏览器,不启用压缩
4) compressableMimeType="text/html,text/xml" 压缩类型
我 这里的配置内容为:
1
<
Connector
port
="80"
maxHttpHeaderSize
="8192"
2
maxThreads
="150"
minSpareThreads
="25"
maxSpareThreads
="75"
3
enableLookups
="false"
redirectPort
="8443"
acceptCount
="100"
4
connectionTimeout
="20000"
disableUploadTimeout
="true"
URIEncoding
="utf-8"
5
compression
="on"
6
compressionMinSize
="2048"
7
noCompressionUserAgents
="gozilla, traviata"
8
compressableMimeType
="text/html,text/xml,text/javascript,text/css,text/plain"
/>
9
<!--
Note : To disable connection timeouts, set connectionTimeout value
10
to 0
-->
11
12
<!--
Note : To use gzip compression you could set the following properties :
13
14
compression="on"
15
compressionMinSize="2048"
16
noCompressionUserAgents="gozilla, traviata"
17
compressableMimeType="text/html,text/xml"
18
-->
19
一旦启用了这个压缩功能后,我们怎么来测试压缩是否有效呢?首先Tomcat是根据浏览器请求头中的accept-encoding来判断浏览器是否支持压缩功能,如果这个值包含有gzip,就表明浏览器支持gzip压缩内容的浏览,所以我们可以用httpclient来写一个这样的简单测试程序
import org.apache.commons.httpclient.HttpClient;
import org.apache.commons.httpclient.methods.GetMethod;public class HttpTester {
public static void main(String[] args) throws Exception{
HttpClient http = new HttpClient();
GetMethod get = new GetMethod("http://www.dlog.cn/js/prototype.js");
try{
get.addRequestHeader("accept-encoding", "gzip,deflate");
get.addRequestHeader("user-agent", "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0; Alexa Toolbar; Maxthon 2.0)");
int er = http.executeMethod(get);
if(er==200){
System.out.println(get.getResponseContentLength());
String html = get.getResponseBodyAsString();
System.out.println(html);
System.out.println(html.getBytes().length);
}
}finally{
get.releaseConnection();
}
}}
执行这个测试程序,看看它所输出的是什么内容,如果输出的是一些乱码,以及打印内容的长度远小于实际的长度,那么恭喜你,你的配置生效了,你会发现你网站的浏览速度比以前快多了。
二, 对于Apache而言,有两种情况
1)针对Apache2.0之前的版本,它原本是不支持 的,不过可以通过添加第三方的module_gzip模块来启用
2)针对Apache2.0及之后的版本,Apache提供支持, 不过不叫gzip,而叫mod_deflate
下面就对Apache2.0及之后的版本作一个说明
1) 去掉#LoadModule headers_module modules/mod_headers.so前面的注释#,
2) 添加LoadModule deflate_module modules/mod_deflate.so
3) 在VirtualHost中添加
1
<
Location
"/"
>
2
SetOutputFilter DEFLATE
3
BrowserMatch ^Mozilla/4 gzip-only-text/html
4
BrowserMatch ^Mozilla/4\.0[678] no-gzip
5
BrowserMatch \bMSIE !no-gzip !gzip-only-text/html
6
SetEnvIfNoCase Request_URI \.(?:gif|jpe?g|png)$ no-gzip dont-vary
7
Header append Vary User-Agent env=!dont-vary
8
</
Location
>
9
我这里面有一个完整的演示
1
# 加载deflate模块
2
LoadModule headers_module modules/mod_headers.so
3
LoadModule deflate_module modules/mod_deflate.so
4
<
VirtualHost
*:80
>
5
DocumentRoot f:/apacheTest
6
<
Location
"/"
>
7
SetOutputFilter DEFLATE
8
BrowserMatch ^Mozilla/4 gzip-only-text/html
9
BrowserMatch ^Mozilla/4\.0[678] no-gzip
10
BrowserMatch \bMSIE !no-gzip !gzip-only-text/html
11
SetEnvIfNoCase Request_URI \.(?:gif|jpe?g|png)$ no-gzip dont-vary
12
Header append Vary User-Agent env=!dont-vary
13
</
Location
>
14
</
VirtualHost
>
关于 JavaScript的gzip静态压缩方法
传统的JS压缩(删除注释,删除多余空格等)提供的压缩率有时还是不尽不意,幸亏现在的浏览器都支持压缩传输(通过设置http header的Content-Encoding=gzip),可以通过服务器的配置(如apache)为你的js提供压缩传输,或是appfuse中使用的GZipFilter使tomcat也提供这种能力
现在的问题是这种动态的压缩会导致服务器CPU占用率过高,现在我想到的解决辨法是通过提供静态压缩(就是将js预先通过gzip.exe压缩好)
一.下面描述在tomcat中的应用
1.将prototype.js通过gzip.exe压缩保存成prototype.gzjs
2.设置header,我编写了一个简单的AddHeadersFilter来将所有以gzjs结尾的文件增加设置header Content-Encoding=gzip
web.xml中的配置
<filter>
<filter-name>AddHeaderFilter</filter-name>
<filter-class>
badqiu.web.filter.AddHeaderFilter
</filter-class>
<init-param>
<param-name>headers</param-name>
<param-value>Content-Encoding=gzip</param-value>
</init-param>
</filter>
<filter-mapping>
<filter-name>AddHeaderFilter</filter-name>
<url-pattern>*.gzjs</url-pattern>
</filter-mapping>
测试prototype.js是否正常的代码
<html>
<head>
<!-- type="text/javascript"不可少,有些浏览器缺少这个不能运行,具体已经忘记了 -->
<script src="prototype.gzjs" type="text/javascript"></script>
</head>
<body>
<input id="username" name="username" value="badqiu"/><br />
<input id="email" value="badqiu@gmail.com"/>
<script>
<!-- 测试prototype的方法是否正常-->
alert($F('username'))
</script>
</body>
</html>
在Apache httpd中可以直接通过在httpd.conf增加AddEncoding x-gzip .gzjs来映射.gzjs文件的header
二.相关压缩率数据
1. prototype.js 1.5.0_rc0原始大小56KB,未经任何处理直接使用gzip压缩为12KB,总压缩率79%
2. 通过js压缩工具压缩过的protytype.js为20KB,使用gzip压缩为10KB,总压缩率为83%
3. 实际项目中的多个js合并成的文件 439KB,直接通过gzip压缩为85KB,总压缩率81%
4. 439KB经过js压缩为165KB,再经过gzip压缩为65KB,总压缩率86%
基本上你都可以忽略js压缩工具的压缩率,直接使用gzip压缩