本日志内容来自互联网和平日使用经验,整理一下方便日后参考。

Nginx Rewrite 相关指令有 if、rewrite、set、return 等。
if 的语法 应用于 server 和 location 环境内

if(condition){...}

if可以支持的正则表达式匹配符号有:

1、~ 为区分大小写匹配
2、~* 为不区分大小写匹配
3、!~和!~*分别为区分大小写不匹配及不区分大小写不匹配

文件及目录匹配有:

1、-f和!-f用来判断是否存在文件
2、-d和!-d用来判断是否存在目录
3、-e和!-e用来判断是否存在文件或目录
4、-x和!-x用来判断文件是否可执行

if环境下每行rewrite指令最后应该跟一个flag标记,支持的flag标记有:

1、last 相当于Apache里的[L]标记,表示完成rewrite
2、break 终止匹配, 不再匹配后面的规则
3、redirect 返回302临时重定向 地址栏会显示跳转后的地址
4、permanent 返回301永久重定向 地址栏会显示跳转后的地址

  last 和 break 标记的区别在于,last 标记在本条 rewrite 规则执行完后,会对其所在的server { … } 标签重新发起请求,而 break 标记则在本条规则匹配完成后,停止匹配,不再做后续的匹配。另有些时候必须使用 last,比如在使用 alias 指令时,而使用 proxy_pass指令时则必须使用 break。

location /abc/ {
  rewrite "^/abc/(.*)\.html$"    /abc/index.html    last;
}

=============应该将上面的last改为break,否则引起死循环=============

  redirect 和 permanent 区别则是返回的不同方式的重定向,对于客户端来说一般状态下是没有区别的。而对于搜索引擎,相对来说 301 的重定向更加友好,如果我们把一个地址采用 301 跳转方式跳转的话,搜索引擎会把老地址的相关信息带到新地址,同时在搜索引擎索引库中彻底废弃掉原先的老地址。
  使用 302 重定向时,搜索引擎(特别是 google)有时会查看跳转前后哪个网址更直观,然后决定显示哪个,如果它觉的跳转前的 URL 更好的话,也许地址栏不会更改,那么很有可能出现 URL 劫持的现像。
  我们在做 URI 重写时,有时会发现 URI 中含有相关参数,如果需要将这些参数保存下来,并且在重写过程中重新引用,我们可以用到 () 和 $N 的方式来解决。

例如下面设定nginx在用户使用ie时将重定向到/nginx-ie目录下:

if ($http_user_agent ~ MSIE) {
     rewrite ^(.*)$    /nginx-ie/$1    break;
}

匹配访问的url地址是个目录,则自动加“/”

if (-d $request_filename){
     rewrite  ^/(.*)([^/])$    http://$host/$1$2/     permanent;
}

[PS:一般在location中即(location /{.....})或直接在server标签中编写rewrite规则,推荐使用last标记,在非根location中(location /cms/{....}),则使用break标记]

==============实例=================

禁止htaccess

location ~/\.ht {
      deny all;
}

禁止多个目录

location ~ ^/(cron|templates)/ {
     deny all;
     break;
}

禁止以/data开头的文件
可以禁止/data/下多级目录下.log.txt等请求;

location ~ ^/data {
      deny all;
}

禁止单个目录
不能禁止.log.txt能请求

location /searchword/cron/ {
     deny all;
}

禁止单个文件

location ~ /data/sql/data.sql {
      deny all;
}

给favicon.ico和robots.txt设置过期时间;
这里为favicon.ico为99天,robots.txt为7天并不记录404错误日志

location ~(favicon.ico) {
    log_not_found off;
    expires 99d;
     break;
}
location ~(robots.txt) {
      log_not_found off;
      expires 7d;
      break;
}

设定某个文件的过期时间;这里为600秒,并不记录访问日志

location ^~ /html/scripts/loadhead_1.js {
      access_log   off;
       root /opt/lampp/htdocs/web;
       expires 600;
        break;
}

文件反盗链并设置过期时间
这里的return 412 为自定义的http状态码,默认为403,方便找出正确的盗链的请求
“rewrite ^/ http://leech.c1gstudio.com/leech.gif;”显示一张防盗链图片
“access_log off;”不记录访问日志,减轻压力
“expires 3d”所有文件3天的浏览器缓存

location ~* ^.+\.(jpg|jpeg|gif|png|swf|rar|zip|css|js)$ {
      valid_referers none blocked *.c1gstudio.com *.c1gstudio.net localhost 208.97.167.194;
     if ($invalid_referer) {
            rewrite ^/ http://leech.c1gstudio.com/leech.gif;
            return 412;
            break;
           }
        access_log   off;
        root    /opt/lampp/htdocs/web;
        expires 3d;
        break;
}

只允许固定ip访问网站,并加上密码

root   /opt/htdocs/www;
allow   208.97.167.194;
allow   222.33.1.2;
allow   231.152.49.4;
deny    all;
auth_basic "C1G_ADMIN";
auth_basic_user_file htpasswd;

将多级目录下的文件转成一个文件,增强seo效果,如:/job-123-456-789.html 指向/job/123/456/789.html

rewrite  ^/job-([0-9]+)-([0-9]+)-([0-9]+)\.html$   /job/$1/$2/jobshow_$3.html   last;

将根目录下某个文件夹指向2级目录,如:如/shanghaijob/ 指向 /area/shanghai/
如果你将last改成permanent,那么浏览器地址栏显是/location/shanghai/

rewrite ^/([0-9a-z]+)job/(.*)$    /area/$1/$2   last;

上面例子有个问题是访问/shanghai 时将不会匹配

rewrite ^/([0-9a-z]+)job$     /area/$1/      last;
rewrite ^/([0-9a-z]+)job/(.*)$    /area/$1/$2     last;

这样/shanghai 也可以访问了,但页面中的相对链接无法使用,如./list_1.html真实地址是/area/shanghai/list_1.html会变成/list_1.html,导至无法访问。

那我加上自动跳转也是不行,(-d $request_filename)它有个条件是必需为真实目录,而我的rewrite不是的,所以没有效果

if (-d $request_filename){
     rewrite ^/(.*)([^/])$    http://$host/$1$2/     permanent;
}

知道原因后就好办了,让我手动跳转吧

rewrite ^/([0-9a-z]+)job$     /$1job/     permanent;
rewrite ^/([0-9a-z]+)job/(.*)$    /area/$1/$2     last;

文件和目录不存在的时候重定向:

if (!-e $request_filename) {
        proxy_pass http://127.0.0.1;
}

域名跳转

server
{
    listen       80;
    server_name  jump.c1gstudio.com;
    index index.html index.htm;
    root    /opt/lampp/htdocs/www;
    rewrite ^/ http://www.c1gstudio.com/;
     access_log  off;
}

多域名转向

server_name  www.c1gstudio.com www.c1gstudio.net;
index index.html index.htm;
root  /opt/lampp/htdocs;
if ($host ~ "c1gstudio\.net") {
        rewrite ^(.*) http://www.c1gstudio.com$1   permanent;
}

三级域名跳转

if ($http_host ~* "^(.*)\.i\.c1gstudio\.com$") {
       rewrite ^(.*) http://top.yingjiesheng.com$1;
       break;
}

域名镜像

server
{
      listen       80;
      server_name  mirror.c1gstudio.com;
      index index.html index.htm;
      root  /opt/lampp/htdocs/www;
      rewrite ^/(.*) http://www.c1gstudio.com/$1    last;
      access_log  off;
}

某个子目录作镜像

location ^~ /zhaopinhui {
      rewrite ^.+ http://zph.c1gstudio.com/     last;
      break;
}

一些可用的全局变量有,可以用做条件判断(待补全)

1、$args,待请求的参数
2、$content_length,内容大小
3、$content_type,内容类型
4、$document_root,当前请求的根路径设置值
5、$document_uri,与$uri一样,URI地址
6、$host,请求信息中的“Host”,如果没有Host行,则等于设置的服务器名
7、$http_user_agent,用户代理(客户端浏览器类型)
8、$http_cookie,cookie设置
9、$limit_rate,对连接速率的限制
10、$request_body_file,,往nginx代理服务器上传文件时,nginx创建的临时文件
11、$request_method,请求的方法,比如“GET”,“POST”等
12、$remote_addr,客户端地址
13、$remote_port,客户端端口
14、$remote_user,客户端用户名,认证用
15、$request_filename,当前请求的文件路径名
16、$request_uri
17、$query_string,与$args相同
18、$scheme,所有的协议,比如http或https
19、$server_protocol,请求的协议
20、$server_addr,服务器地址
21、$server_name,服务器名
22、$server_port,服务器端口
23、$uri,URI地址