nginx路由规则配置 nginx路由匹配

转载

mob64ca140530fb 2024-03-28 10:52:17

文章标签 nginx路由规则配置运维 php 操作系统正则表达式 文章分类 运维

　　nginx中location对url匹配；

　　语法：location [=|~|~*|^~] /uri/ { … }

　　当匹配中符合条件的location，则执行内部指令；如果使用正则表达式，必须使用~*表明不区分大小写或者~区分大小写匹配；例如：location ~* \.(gif|jpg|jpeg)$ ；当配皮成功后，将停止往下匹配；如果没有找到，则使用常规自字符串处理结果；

　　如果不是用正则表达式；可使用=严格匹配；

　　如果使用^~前缀用于一个常规字符串；表示如果路径匹配，则不测试正则表达式；

　　总结：指令按下列顺序被接受

　　　　1:=前缀的指令严格匹配这个查询；如果找到停止往下匹配

　　　　2:挣下的常规字符串，长的在前，如果这个匹配使用^~前缀，匹配停止；

　　　　3:正则表达式，按配置文件的顺序；

　　　　4:如果第三步产生匹配。则使用这个结果；停止匹配；否则使用第二部的匹配结果；

四个案例：

location = / {

　　　　#只匹配／查询

　　}

　　location / {

　　　　#匹配任何查询，所有请求都是以/开头。但是正则表达式规则和长的块规则将被优先匹配和查询；

　　}

　　location ^~ /images/ {
　　　　# 匹配任何已 /images/ 开头的任何查询并且停止搜索。任何正则表达式将不会被测试。
　　　　}

　　location ~* \.(gif|jpg|png)${

　　　　#匹配任何以gif、jpg、png结尾的请求。然后所有/images/目录的请求将使用第三个

　　}

　　例子请求:

　　　　/ -> configuration A

　　　　/documents/document.html -> configuration B

　　　　/images/1.gif -> configuration C

　　　　/documents/1.jpg -> configuration D

八个location案例

location = / {  #精确匹配，/后面不能加任何字符串，符合此条件就直接返回数据，不再像下匹配。
    if (-d $request_filename) {
         root /usr/local/nginx/html/;  #当用户访问newweb的时候，则显示此目录的内容，除此之外访问其他的任何目录都不匹配。
　　[动作A]
}

location  / {
  # 因为所有的地址都以/开头，所以这条规则将匹配到所有请求，但是非精确匹配会采取正则和最长字符串会优先匹配，因此还会向下继续匹配，比如当访问/bbs的时候，还需要看下面是否更精确的匹配。
  [ 动作B] 
}

location /documents/ {
  # 匹配任何以 /documents/ 开头的地址，匹配符合以后，还要继续往下搜索
  # 如果后面的正则表达式都没有匹配到，就匹配这一条
  [动作C] 
}

location ^~ /images/ {   #匹配任何以/images/ 开头的任何请求并且停止搜索，后面任何正则表达式将不会被测试。
  # 匹配任何以 /images/ 开头的地址，匹配符合以后，停止往下搜索正则，采用这一条。
  [动作D] 
}

location ~* \.(gif|jpg|jpeg)$ {  #~*为不区分大小写
  # 匹配所有以 gif,jpg或jpeg 结尾的请求
  # 然而，所有请求/images/下的图片会被动作D匹配处理，因为动作D有^~会优先匹配并终止匹配，所以到达不了这一条正则
  [动作E] 
}

location /images/ {
  # 字符匹配到 /images/，继续往下，会发现 ^~ 存在，如果动作D存在，则这一条就不生效。
  [动作F] 
}

location /images/abc {
  #最长字符匹配到 /images/abc，继续往下，会发现 ^~ 存在，如果D存在，则这一条就不生效。
  #F与G的放置顺序是没有关系的
  [动作G] 
}

location ~ /images/abc/ {
  # 动作D存在，这一条不生效，如果注销动作D，则会优先最长匹配 动作G 开头的地址，然后向下匹配，到这一条的时候就会匹配并生效。
    [ configuration H ] 
}

 匹配优先级，顺序 no优先级：
(location =) > (location 完整路径) > (location ^~ 路径) > (location ~,~* 正则顺序) > (location 部分起始路径) > (/)

上面的匹配结果
按照上面的location写法，以下的匹配示例成立：

/ -> config A
精确完全匹配，即使/index.html也匹配不了

/downloads/download.html -> config B
匹配B以后，往下没有任何匹配，采用B

/images/1.gif -> configuration D
匹配到F，往下匹配到D，停止往下

/images/abc/def -> config D
最长匹配到G，往下匹配D，停止往下
你可以看到 任何以/images/开头的都会匹配到D并停止，FG写在这里是没有任何意义的，H是永远轮不到的，这里只是为了说明匹配顺序

/documents/document.html -> config C
匹配到C，往下没有任何匹配，采用C

/documents/1.jpg -> configuration E
匹配到C，往下正则匹配到E

/documents/Abc.jpg -> config CC
最长匹配到C，往下正则顺序匹配到CC，不会往下到E

当匹配成功后location中可以使用rewrite进行路由重写；

　　首先需要了解nginx rewrite中可以使用到的全局变量；

$args　　:请求中get的参数,例如a=1&b=2;
　　$body_remote_add　　:二进制客户地址
　　$body_byte_sent　　:相应时发送出去的body字节数数量，即使链接中断这个数据也是精确的；
　　$content_length　　:请求头中的Content_length字段
　　$content_type　　:请求中的Content_type字段
　　$document_root　　:当前请求在root指令中的位置;服务器中绝对路径
　　$document_url　　:与uri相同
　　$host　　:请求主机头字段，否则为服务器名称；
　　$hostname　　:保存了当前请求中不包含指令的uri，例如：http://www.aaa.com/index.php?a=1中的/index.php;
　　$host　　:请求的服务器名称；
　　$http_user_agent　　:客户端浏览器的详细信息，如果使用 chrome 和Firefox 则访问结果是

Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.87 Safari/537.36 #chrome的浏览器信息
Mozilla/5.0 (Windows NT 6.1; WOW64; rv:46.0) Gecko/20100101 Firefox/46.0  #Firefox的浏览器信息

$http_cookie　　: 客户端cookie信息；
　　$limit_rate　　:如果nginx服务器中使用limit_rate配置了显示网络速率，则会显示，如果没有则为0
　　$remote_addr　　:客户端的地址，每个客户端的公网ip，
　　$remote_port　　:客户端请求nginx服务器时随机打开的端口，这个每个客户端自己的端口；
　　$remote_user　　:已经经过auth basic module验证的用户名
　　$request_body_file　　:作反向代理是发给服务端的本地资源名称
　　$request_method　　:请求志愿的方式，get\put\delete等
　　$request_filename　　:请求的资源文件的路径名称
　　$request_url　　:请求参数的原始uri，不包含主机名；如"/index.php?a=1"
　　$squery_string　　:保存了url请求的指令，与$args相同
　　$scheme　　:请求协议；如http、https、ftp
　　$server_protacpl　　:保存了客户端请求资源使用的协议的版本，如http/1.0、http/1.1
　　$server_addr　　:保存了服务器ip
　　$server_name　　:保存了服务器的主机名；该变量不一定是用户访问的域名，是你的server_name配的地址；
　　$host　　:保存了用户访问的域名
　　$server_port　　:服务器端口
　　$uri与$document_uri相同　　：不包含指令的uri地址

如www.aaa.com/index.php?a=1&b=2中的index.php

防盗链：注意location生效规则，否则防盗链不起作用。

配置参数说明：

none
　　　　'Referer' :来源头部为空的情况
　　blocked
　　　　'Referer' :来源头部不为空，但里面的值被代理或者防火墙删除，这些值都不以http://或者https://开头
　　server_names
　　　　'Referer' :来源头部包含当前的server_name,就是域名
　　arbitary string :任意字符串，定义服务器名或者可选的url前缀，主机名可以使用*开头或者结尾，在检测来源头部这个过程中，来源域名中的主机端口将会被忽视；
　　regular expression :正则表达式，表示排除https://或者http://开头的字符串

下面两个案例：

location ~* \.(gif|jpg|png|bmp)$ {
    valid_referers none blocked *.aaa.com server_names ~\.google\. ~\.baidu\.;
    if ($invalid_referer) {
        return 403;
        #rewrite ^/ http://www.aaa.com/1.jpg;
    }
}
以上所有来至aaa.com和域名中包含google和baidu的站点都可以访问到当前站点的图片,如果来源域名不在这个列表中，那么$invalid_referer等于1，在if语句中返回一个403给用户，这样用户便会看到一个403的页面,如果使用下面的rewrite，那么盗链的图片都会显示403.jpg。如果用户直接在浏览器输入你的图片地址,那么图片显示正常，因为它符合none这个规则.

location ~* \.(gif|jpg|png|swf|flv)$ { # 防盗链设置,对于后缀是gif、jgp等格式的生效
    valid_referers none blocked  a.com  *.a.com; #定义允许访问的请求链接
    if ($invalid_referer) {
        return 404;
    }
}

none：在浏览器输入网站域名直接访问的请求，需要允许访问的
blocked：有referer首部，但是referer首部被清除了，一般是防火墙改过的请求
server_name:带服务器名称的，一般是本机或其他服务器的请求，a.com和*.a.com是本公司的域名，要允许访问于是要先允许本机的访问，再禁止其他服务器的访问

location /public/admin/images/y.jpg {
      #valid_referers none blocked *.aaa.com server_names *.aaa.com    ;
      #valid_referers none blocked www.sss.com; #设置只有该域>    名可以访问
      valid_referers none blocked 111.111.111.11; #设置只有该域名可以访>    问
      if ($invalid_referer) {
          rewrite ^ http://baidu.com$request_uri?;
          return 403;
          rewrite ^/ http://www.aaa.com/1.jpg;
      }
 }

常用正则匹配

. ： 匹配除换行符以外的任意字符
? ： 重复0次或1次
+ ： 重复1次或更多次
* ： 重复0次或更多次
\d ：匹配数字
^ ： 匹配字符串的开始
$ ： 匹配字符串的介绍
{n} ： 重复n次
{n,} ： 重复n次或更多次
[c] ： 匹配单个字符c
[a-z] ： 匹配a-z小写字母的任意一个
小括号()之间匹配的内容，可以在后面通过$1来引用，$2表示的是前面第二个()里的内容。正则里面容易让人困惑的是\转义特殊字符。

参考if判断语句

if ($http_user_agent ~ MSIE) { #如果客户端是微软的IE浏览器，就将请求rewrite到msie目录下。
    rewrite ^(.*)$ /msie/$1 break;
} 

if ($http_cookie ~* "id=([^;]+)(?:;|$)") { # 如果cookie匹配正则，就设置变量$id等于正则引用部分
    set $id $1; 设置$id等于正则第一个括号内匹配的部分
 } 

if ($request_method = POST) { #如果提交方法为POST，则返回状态405（Method not allowed）。return不能返回301,302
    return 405;
} 

if ($slow) { #限速，$slow可以通过 set 指令设置
    limit_rate 10k;
} 

if (!-f $request_filename){ #如果请求的文件名不存在，则反向代理到localhost 。这里的break也是停止rewrite检查
    break;
    proxy_pass  http://127.0.0.1; 
} 

if ($args ~ post=140){ #如果query string中包含"post=140"，永久重定向到example.com
    rewrite ^ http://example.com/ permanent;
}

nginx 配置案例参考

http {
    # 定义image日志格式
    log_format imagelog '[$time_local] ' $image_file ' ' $image_type ' ' $body_bytes_sent ' ' $status;
    # 开启重写日志
    rewrite_log on;

    server {
        root /home/www;

        location / {
                # 重写规则信息
                error_log logs/rewrite.log notice; 
                # 注意这里要用‘’单引号引起来，避免{}
                rewrite '^/images/([a-z]{2})/([a-z0-9]{5})/(.*)\.(png|jpg|gif)$' /data?file=$3.$4;
                # 注意不能在上面这条规则后面加上“last”参数，否则下面的set指令不会执行
                set $image_file $3;
                set $image_type $4;
        }

        location /data {
                # 指定针对图片的日志格式，来分析图片类型和大小
                access_log logs/images.log mian;
                root /data/images;
                # 应用前面定义的变量。判断首先文件在不在，不在再判断目录在不在，如果还不在就跳转到最后一个url里
                try_files /$arg_file /image404.html;
        }
        location = /image404.html {
                # 图片不存在返回特定的信息
                return 404 "image not found\n";
        }
}

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。