利用nginx的rewrite命令,可以实现URL的重写,可在nginx配置文件的server、location、if部分使用,对于rewrite有四种不同的flag。

redirect:返回302临时重定向,浏览器地址栏会显示跳转后的URL地址,爬虫不会更新URL
permanent:返回301永久重定向,浏览器地址栏会显示跳转后的URL地址,爬虫会更新URL
break:停止处理后续rewrite指令集,不会跳出location作用域,不再进行重新查找,终止匹配,URL地址不变
last:停止处理后续rewrite指令集,跳出location作用域,并开始搜索与更改后的URI相匹配的location,URL地址不变

其中redirect和permanent很好理解,直接对URL地址进行重定向,显示跳转后的URL地址,从实现功能的角度看,redirect和permanent是一样的,不存在好坏和性能上的问题,主要会对seo所有影响。

举例说明break和last,下面是一个配置示例:

 
1
2
3
4
5
6
7
8
9
10
11
location /abc/ {
rewrite ^/abc/(.*) /whsir/$1 break;
return 401;
}
location /opq/ {
rewrite ^/opq/(.*) /whsir/$1 last;
return 402;
}
location /whsir/ {
return 403;
}

访问http://DEMO/abc/*时,返回404,如果whsir目录下存在对应文件则返回200

访问http://DEMO/opq/*时,匹配到了/whsir/,然后跳出location作用域,匹配到了location /whsir/,然后返回403

break和last一样都会停止处理后续rewrite模块指令的运行,但是last会重新发起一个请求,并重新匹配location