java代码如何修改nginx缓存数据 nginx配置缓存

转载

lanhy 2024-06-07 22:04:01

文章标签 java代码如何修改nginx缓存数据 memcached nginx cache web服务 文章分类 Java 后端开发

通过《高性能Web服务器Nginx的配置与部署研究——（11）应用模块之Memcached模块的两大应用场景》一文，我们知道Nginx从Memcached读取数据的方式，如果命中，那么效率是相当高的。那么：

1. 如果不命中呢？

我们可以到相应的数据服务器上读取数据，然后将它缓存到Nginx服务器上，然后再将该数据返回给客户端。这样，对于该资源，只有穿透Memcached的第一次请求是需要到数据服务器读取的，之后在缓存过期时间之内的所有请求，都是读取Nginx本地的。不过Nginx的proxy_cache是本地硬盘缓存，效率要远低于Memcached。

2. 应该如何安装和配置呢？

（1）HttpMemcModule模块

如果使用Nginx的非核心模块——HttpMemcModule模块，则可以下载模块：

http://github.com/agentzh/memc-nginx-module/tags

michael@dev-machine:~$ tar -zxvf agentzh-memc-nginx-module-a0bc33a.tar.gz  
michael@dev-machine:~$ tar -zxvf nginx-1.1.12.tar.gz  
michael@dev-machine:~$ cd nginx-1.1.12  
michael@dev-machine:~$ ./configure --add-module=/home/michael/agentzh-memc-nginx-module-a0bc33a  
michael@dev-machine:~$ sudo make  
michael@dev-machine:~$ sudo make install

michael@dev-machine:~$ tar -zxvf agentzh-memc-nginx-module-a0bc33a.tar.gz
michael@dev-machine:~$ tar -zxvf nginx-1.1.12.tar.gz
michael@dev-machine:~$ cd nginx-1.1.12
michael@dev-machine:~$ ./configure --add-module=/home/michael/agentzh-memc-nginx-module-a0bc33a
michael@dev-machine:~$ sudo make
michael@dev-machine:~$ sudo make install

目前

~~验证发现Nginx 1.0.10版本~~ Nginx的1.1.3及其之前的版本，需要额外通过--add-module来加载upstream-keepalive模块，请自行google之。

~~其他版本还不确定，猜测是在1.1~~ 从nginx的1.1.4及其之后的版本开始，自动携带upstream-keeplive模块的。（感谢agentzh的提示）

然后我们来编辑配置文件吧。如下：

http {
	...
	upstream data_server {
		server	192.168.0.133:1234;
		server	192.168.0.134:1234;
		server	192.168.0.135:1234;
		ip_hash;
	}

	upstream memc_backend {
		server	127.0.0.1:11211;
	}
	...
	server {

		listen		8080;
		server_name	localhost;

		default_type	text/html;

		location / {
			set		$memc_cmd	get;
			set		$memc_key	$uri;
			memc_pass	memc_backend;

			error_page	404 @fallback;
		}

		location @fallback {

			internal;

			proxy_pass		http://data_server;

			proxy_cache		cache_one;
			proxy_cache_valid	200 302 1h;
			proxy_cache_valid	301 1d;
			proxy_cache_valid	any 1m;
			expires			30d;
		}
	}
	...
}

http {  
    ...  
    upstream data_server {  
        server  192.168.0.133:1234;  
        server  192.168.0.134:1234;  
        server  192.168.0.135:1234;  
        ip_hash;  
    }  
  
    upstream memc_backend {  
        server  127.0.0.1:11211;  
    }  
    ...  
    server {  
  
        listen      8080;  
        server_name localhost;  
  
        default_type    text/html;  
  
        location / {  
            set     $memc_cmd   get;  
            set     $memc_key   $uri;  
            memc_pass   memc_backend;  
  
            error_page  404 @fallback;  
        }  
  
        location @fallback {  
  
            internal;  
  
            proxy_pass      http://data_server;  
  
            proxy_cache     cache_one;  
            proxy_cache_valid   200 302 1h;  
            proxy_cache_valid   301 1d;  
            proxy_cache_valid   any 1m;  
            expires         30d;  
        }  
    }  
    ...  
}

从上面的配置文件我们可以看出，一个请求到达后，会其uri作为key去Memcached服务器127.0.0.1:11211上查找value，如果没有命中，则返回404。这时通过error_page将404接收转到@fallback，然后去data_server中取文件，取完后将该文件在本地磁盘缓存，同时用户的浏览器也通过expires设置缓存时间。

这样绝大多数请求如果被第一层Memcached的内存缓存拦截的话，剩余的请求可以通过访问第二层Nginx服务器的硬盘缓存文件，来减少穿透。

按照上面的方式，客户端得到的请求响应中虽然包含了正确的文件内容，但状态码都是404（可以通过Fiddler来观察）。这似乎会引起问题。什么问题呢？绝大多数浏览器，即使在404的情况下，也会尝试去读取内容，如果有正确的内容，是可以正确显示的。但是比较常见的可能引起问题的两种情况是：

（a）、搜索引擎的spider爬到的404时，一般不会收录该URL，我想这不是你所希望看到的；

（b）、Flash等方式加载时，如果头是404，可能不予显示，我想着也不是你所希望看到的。

那我们把它改成都是200，是不是很好呢？