nginx中location对url匹配;

  语法:location [=|~|~*|^~] /uri/ { … }

  当匹配中符合条件的location,则执行内部指令;如果使用正则表达式,必须使用~*表明不区分大小写或者~区分大小写匹配;例如:location ~* \.(gif|jpg|jpeg)$ ;当配皮成功后,将停止往下匹配;如果没有找到,则使用常规自字符串处理结果;

  如果不是用正则表达式;可使用=严格匹配;

  如果使用^~前缀用于一个常规字符串;表示如果路径匹配,则不测试正则表达式;

  总结:指令按下列顺序被接受

    1:=前缀的指令严格匹配这个查询;如果找到停止往下匹配

    2:挣下的常规字符串,长的在前,如果这个匹配使用^~前缀,匹配停止;

    3:正则表达式,按配置文件的顺序;

    4:如果第三步产生匹配。则使用这个结果;停止匹配;否则使用第二部的匹配结果;

四个案例:



location = / {

    #只匹配/查询

  }

  location / {

    #匹配任何查询,所有请求都是以/开头。但是正则表达式规则和长的块规则将被优先匹配和查询;

  }

  location ^~ /images/ {
    # 匹配任何已 /images/ 开头的任何查询并且停止搜索。任何正则表达式将不会被测试。
    }

  location ~* \.(gif|jpg|png)${

    #匹配任何以gif、jpg、png结尾的请求。然后所有/images/目录的请求将使用第三个

  }

  例子请求:

    / -> configuration A

    /documents/document.html -> configuration B

    /images/1.gif -> configuration C

    /documents/1.jpg -> configuration D



 

八个location案例



location = / {  #精确匹配,/后面不能加任何字符串,符合此条件就直接返回数据,不再像下匹配。
    if (-d $request_filename) {
         root /usr/local/nginx/html/;  #当用户访问newweb的时候,则显示此目录的内容,除此之外访问其他的任何目录都不匹配。
  [动作A]
}

location  / {
  # 因为所有的地址都以/开头,所以这条规则将匹配到所有请求,但是非精确匹配会采取正则和最长字符串会优先匹配,因此还会向下继续匹配,比如当访问/bbs的时候,还需要看下面是否更精确的匹配。
  [ 动作B] 
}

location /documents/ {
  # 匹配任何以 /documents/ 开头的地址,匹配符合以后,还要继续往下搜索
  # 如果后面的正则表达式都没有匹配到,就匹配这一条
  [动作C] 
}

location ^~ /images/ {   #匹配任何以/images/ 开头的任何请求并且停止搜索,后面任何正则表达式将不会被测试。
  # 匹配任何以 /images/ 开头的地址,匹配符合以后,停止往下搜索正则,采用这一条。
  [动作D] 
}

location ~* \.(gif|jpg|jpeg)$ {  #~*为不区分大小写
  # 匹配所有以 gif,jpg或jpeg 结尾的请求
  # 然而,所有请求/images/下的图片会被动作D匹配处理,因为动作D有^~会优先匹配并终止匹配,所以到达不了这一条正则
  [动作E] 
}

location /images/ {
  # 字符匹配到 /images/,继续往下,会发现 ^~ 存在,如果动作D存在,则这一条就不生效。
  [动作F] 
}

location /images/abc {
  #最长字符匹配到 /images/abc,继续往下,会发现 ^~ 存在,如果D存在,则这一条就不生效。
  #F与G的放置顺序是没有关系的
  [动作G] 
}

location ~ /images/abc/ {
  # 动作D存在,这一条不生效,如果注销动作D,则会优先最长匹配 动作G 开头的地址,然后向下匹配,到这一条的时候就会匹配并生效。
    [ configuration H ] 
}

 匹配优先级,顺序 no优先级:
(location =) > (location 完整路径) > (location ^~ 路径) > (location ~,~* 正则顺序) > (location 部分起始路径) > (/)

上面的匹配结果
按照上面的location写法,以下的匹配示例成立:

/ -> config A
精确完全匹配,即使/index.html也匹配不了

/downloads/download.html -> config B
匹配B以后,往下没有任何匹配,采用B

/images/1.gif -> configuration D
匹配到F,往下匹配到D,停止往下

/images/abc/def -> config D
最长匹配到G,往下匹配D,停止往下
你可以看到 任何以/images/开头的都会匹配到D并停止,FG写在这里是没有任何意义的,H是永远轮不到的,这里只是为了说明匹配顺序

/documents/document.html -> config C
匹配到C,往下没有任何匹配,采用C

/documents/1.jpg -> configuration E
匹配到C,往下正则匹配到E

/documents/Abc.jpg -> config CC
最长匹配到C,往下正则顺序匹配到CC,不会往下到E



 

当匹配成功后location中可以使用rewrite进行路由重写;

  首先需要了解nginx rewrite中可以使用到的全局变量;

$args  :请求中get的参数,例如a=1&b=2;
  $body_remote_add  :二进制客户地址
  $body_byte_sent  :相应时发送出去的body字节数数量,即使链接中断这个数据也是精确的;
  $content_length  :请求头中的Content_length字段
  $content_type  :请求中的Content_type字段
  $document_root  :当前请求在root指令中的位置;服务器中绝对路径
  $document_url  :与uri相同
  $host  :请求主机头字段,否则为服务器名称;
  $hostname  :保存了当前请求中不包含指令的uri,例如:http://www.aaa.com/index.php?a=1中的/index.php;
  $host  :请求的服务器名称;
  $http_user_agent  :客户端浏览器的详细信息,如果使用 chrome 和Firefox 则访问结果是



Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.87 Safari/537.36 #chrome的浏览器信息
Mozilla/5.0 (Windows NT 6.1; WOW64; rv:46.0) Gecko/20100101 Firefox/46.0  #Firefox的浏览器信息


$http_cookie  : 客户端cookie信息;
  $limit_rate  :如果nginx服务器中使用limit_rate配置了显示网络速率,则会显示,如果没有则为0
  $remote_addr  :客户端的地址,每个客户端的公网ip,
  $remote_port  :客户端请求nginx服务器时随机打开的端口,这个每个客户端自己的端口;
  $remote_user  :已经经过auth basic module验证的用户名
  $request_body_file  :作反向代理是发给服务端的本地资源名称
  $request_method  :请求志愿的方式,get\put\delete等
  $request_filename  :请求的资源文件的路径名称
  $request_url  :请求参数的原始uri,不包含主机名;如"/index.php?a=1"
  $squery_string  :保存了url请求的指令,与$args相同
  $scheme  :请求协议;如http、https、ftp
  $server_protacpl  :保存了客户端请求资源使用的协议的版本,如http/1.0、http/1.1
  $server_addr  :保存了服务器ip
  $server_name  :保存了服务器的主机名;该变量不一定是用户访问的域名,是你的server_name配的地址;
  $host  :保存了用户访问的域名
  $server_port  :服务器端口
  $uri与$document_uri相同  :不包含指令的uri地址

如www.aaa.com/index.php?a=1&b=2中的index.php

 

防盗链:注意location生效规则,否则防盗链不起作用。

配置参数说明:

none
    'Referer' :来源头部为空的情况
  blocked
    'Referer' :来源头部不为空,但里面的值被代理或者防火墙删除,这些值都不以http://或者https://开头
  server_names
    'Referer' :来源头部包含当前的server_name,就是域名
  arbitary string :任意字符串,定义服务器名或者可选的url前缀,主机名可以使用*开头或者结尾,在检测来源头部这个过程中,来源域名中的主机端口将会被忽视;
  regular expression :正则表达式,表示排除https://或者http://开头的字符串

下面两个案例:



location ~* \.(gif|jpg|png|bmp)$ {
    valid_referers none blocked *.aaa.com server_names ~\.google\. ~\.baidu\.;
    if ($invalid_referer) {
        return 403;
        #rewrite ^/ http://www.aaa.com/1.jpg;
    }
}
以上所有来至aaa.com和域名中包含google和baidu的站点都可以访问到当前站点的图片,如果来源域名不在这个列表中,那么$invalid_referer等于1,在if语句中返回一个403给用户,这样用户便会看到一个403的页面,如果使用下面的rewrite,那么盗链的图片都会显示403.jpg。如果用户直接在浏览器输入你的图片地址,那么图片显示正常,因为它符合none这个规则.



location ~* \.(gif|jpg|png|swf|flv)$ { # 防盗链设置,对于后缀是gif、jgp等格式的生效
    valid_referers none blocked  a.com  *.a.com; #定义允许访问的请求链接
    if ($invalid_referer) {
        return 404;
    }
}

none:在浏览器输入网站域名直接访问的请求,需要允许访问的
blocked:有referer首部,但是referer首部被清除了,一般是防火墙改过的请求
server_name:带服务器名称的,一般是本机或其他服务器的请求,a.com和*.a.com是本公司的域名,要允许访问于是要先允许本机的访问,再禁止其他服务器的访问



location /public/admin/images/y.jpg {
      #valid_referers none blocked *.aaa.com server_names *.aaa.com    ;
      #valid_referers none blocked www.sss.com; #设置只有该域>    名可以访问
      valid_referers none blocked 111.111.111.11; #设置只有该域名可以访>    问
      if ($invalid_referer) {
          rewrite ^ http://baidu.com$request_uri?;
          return 403;
          rewrite ^/ http://www.aaa.com/1.jpg;
      }
 }



 

常用正则匹配



. : 匹配除换行符以外的任意字符
? : 重复0次或1次
+ : 重复1次或更多次
* : 重复0次或更多次
\d :匹配数字
^ : 匹配字符串的开始
$ : 匹配字符串的介绍
{n} : 重复n次
{n,} : 重复n次或更多次
[c] : 匹配单个字符c
[a-z] : 匹配a-z小写字母的任意一个
小括号()之间匹配的内容,可以在后面通过$1来引用,$2表示的是前面第二个()里的内容。正则里面容易让人困惑的是\转义特殊字符。



 

参考if判断语句



if ($http_user_agent ~ MSIE) { #如果客户端是微软的IE浏览器,就将请求rewrite到msie目录下。
    rewrite ^(.*)$ /msie/$1 break;
} 

if ($http_cookie ~* "id=([^;]+)(?:;|$)") { # 如果cookie匹配正则,就设置变量$id等于正则引用部分
    set $id $1; 设置$id等于正则第一个括号内匹配的部分
 } 

if ($request_method = POST) { #如果提交方法为POST,则返回状态405(Method not allowed)。return不能返回301,302
    return 405;
} 

if ($slow) { #限速,$slow可以通过 set 指令设置
    limit_rate 10k;
} 

if (!-f $request_filename){ #如果请求的文件名不存在,则反向代理到localhost 。这里的break也是停止rewrite检查
    break;
    proxy_pass  http://127.0.0.1; 
} 

if ($args ~ post=140){ #如果query string中包含"post=140",永久重定向到example.com
    rewrite ^ http://example.com/ permanent;
}



 

nginx 配置案例参考



http {
    # 定义image日志格式
    log_format imagelog '[$time_local] ' $image_file ' ' $image_type ' ' $body_bytes_sent ' ' $status;
    # 开启重写日志
    rewrite_log on;

    server {
        root /home/www;

        location / {
                # 重写规则信息
                error_log logs/rewrite.log notice; 
                # 注意这里要用‘’单引号引起来,避免{}
                rewrite '^/images/([a-z]{2})/([a-z0-9]{5})/(.*)\.(png|jpg|gif)$' /data?file=$3.$4;
                # 注意不能在上面这条规则后面加上“last”参数,否则下面的set指令不会执行
                set $image_file $3;
                set $image_type $4;
        }

        location /data {
                # 指定针对图片的日志格式,来分析图片类型和大小
                access_log logs/images.log mian;
                root /data/images;
                # 应用前面定义的变量。判断首先文件在不在,不在再判断目录在不在,如果还不在就跳转到最后一个url里
                try_files /$arg_file /image404.html;
        }
        location = /image404.html {
                # 图片不存在返回特定的信息
                return 404 "image not found\n";
        }
}