使用NginxHttpUpstreamRequestHashModule的方式,增加或减少机器时所引起的hash全部错乱的问题还是很令人担心,所以经过一段时间细致思考,觉得由自己手工制定并实现url hash规则,然后利用nginx的location标签或if语法来实现来得更为灵活,可操作性和可用性会大大加强。不过配置就稍显复杂了,也需要程序方面的支持。

使用这种环境,主要需要考虑链接形式,链接形式不能够是/xxx.jsp?id=1这样的带有?的,否则处理起来会很复杂,需要使用rewrite将这种形式的url变化成/1/1.html,其中加一级目录的目的是可以利用到location标签。如果是纯静态页或图片,一般都会有自成的目录规则。

首先我们制定一个链接的划分规则,这个规则有点区别于文件目录的划分规则,它本身并不需要考虑文件夹内文件数目的多少,制定这个规则的目的是容纳足够多的服务器!一般来说,如果id是字符型的,只需要分出26个字母 10个数字,能够容纳36台cache服务器,这已经很足够了。如果是数字型的id,那就拿数字id0,就可以支持100台cache,已经足够夸张。一般说来,,支持10台服务器应该就足够了,配置也容易一点。

有了这个目录规则,就可以通过nginx的语法来书写配置了。

首先制定一堆upstream,如果是偶数,理论能够分得更均衡。

upstream a {
server 127.0.0.1:3121;
}
upstream b {
server 127.0.0.1:3122;
}
#配置一个all的目的是兼容不进行hash的剩余的页面,比如首页
upstream all {
server 127.0.0.1:3121;
server 127.0.0.1:3122;
}
1、已经按/a/划好的,使用location划分
location ~* /a|b|c|d|e|f|g|h|i|j|k|l|m|n|o|p|q|r/ {
proxy_pass http://a;
} 
location ~* /s|t|u|v|w|x|y|z|0|1|2|3|4|5|6|7|8|9|0/ {
proxy_pass http://b;
}
location / {
proxy_pass http://all;
}
2、已经有一定链接规则,不想变化,可以使用if语句判断
location / {
proxy_pass http://all;
if ( $request_uri ~* /page_(a|b|c|d|e|f|g|h|i|j|k|l|m|n|o|p|q|r)/ ) {
proxy_pass http://a;
}
if ( $request_uri ~* /page_(s|t|u|v|w|x|y|z|0|1|2|3|4|5|6|7|8|9|0)/ ) {
proxy_pass http://b;
}
}

在新增服务器后,需要改动配置,手工将一些目录规则的文件分出去,剩下的仍然访问原先的服务器,不会造成太严重影响。

在这种配置下,像首页这样的访问量大的单页,它访问量大,容量小,所以不可能产生容灾问题。使用轮循的方式工作,会比原先分到死定一台cache,在可用性上要好得多。