nginx的伪静态是基于pcre正则库的机理实现的;所以php中的pcre的正则表达式写法均可以用来进行url重写优化。

记录下今天的nginx伪静态重写进行一些笔记记录。

1.实现thinkphp的pathinfo

方法有好几种,如果要深究pathinfo的含义来重写的话对本次运维而言没有什么意义。直接举例说明:

pathinfo表现形式:http://www.jjonline.cn/index.php/GetUserInfo/SimpleInfo 

说明:对普通的html网页web服务器而言,以上地址就是位于jjonline.cn域下的一台www主机下的index.php目录,再在index.php目录下的目录GetUserInfo,最后打开在GetUserInfo目录下的索引页(index.html 、index.htm、default.html、default.htm等)。

而php有pathinfo()函数,可以借助该函数将以上uri形式的链接分解并返回,这里就不再是以上很狭隘的理解了。

而作为nginx服务器软件来说,如果不进行rewrite配置,那么它就是跟上述说明中一样去寻找这个页面,其结果无非两个,一个刚好有这么一个目录并且这个目录下有相应的索引页;另外一种就是404咯。

我们要做的工作就是先判断有没有这么一个索引页,然后进行请求处理,如果没有就将请求转发到http://www.jjonline.cn/index.php 并将原先后面的/GetUserInfo/SimpleInfo(或者/GetUserInfo/SimpleInfo/)转换为传递给index.php的参数。

好了,开始干活,直接上代码:

location / { 

 

 root /mnt/www; 

 

 index index.php index.html index.htm; 

 

 if (!-e $request_filename) { 

 

 rewerite ^/index.php/(\w+)/(/w+)\*$ /index.php?a=$1&b=$2 last; return 404;

 

 }

 
}

以上只有rewrite部分的代码,而且是在location中,不在处理php的fastcgi方式中!!


说明:


1.if (!-e $request_filename)表示判断是否存在请求地址中的目录或者文件,$request_filename是一个nginx处理好的变量,内容就是请求地址,不用理会,!-e是一个判断条件



2.rewerite ^/index.php/(\w+)/(/w+)\*$  /index.php?a=$1&b=$2 last; 这句话进行一些解释,rewerite是重写指令,后跟一个空格,空格后为对请求连接进行pcre正则匹配的正则表达式,该句中就是^/index.php/(\w+)/(/w+)\*$这一部分,正则表达式后跟一个空格,空格后就是需要传递给谁处理的ur地址,这里的是/index.php?a=$1&b=$2 然后一个空格跟着last并且用了一个';'(英文分号)结尾。



3.针对2中的一些说明,正则表达式匹配的是用户请求的url地址,关于pcre兼容的正则表达式规则不再深入介绍,这里仅仅简要介绍,^表示匹配的开始,$表示匹配的结束,正则表达式中带有圆括号的部分就被整理成了一个变量,这个变量在重写后需要处理该请求的脚本中可以附带为get方式的请求,按照顺序依次是$1、$2等,也就是/index.php?a=$1&b=$2中的两个了;而这里的last的意思就是如果匹配成功就跳出这段代码,后面的return 404就不会执行了,就这么简单。



===========================



从以上说明中可以看出来,nginx的rewrite功能实际上相当于优化了用户所看到的地址栏中的url链接,也优化了搜索引擎的访问,忽悠搜索引擎我这个页面是一个静态化的html页面(实际上现在的搜索引擎已经能很好的支持动态传参url链接了)。还是拿上述例子来说,传统的请求就只能写成http://www.jjonline.cn/index.php?a=GetUserInfo&b=SimpleInfo 了,是不是很难看呢?



  2.用户地址栏中隐藏请求脚本名称

本人做nginx的url重写开通了一个测试地址:http://os.jjonline.cn ;目前已经初步实现了这个功能,具体的实现还得配合更多的rewrite代码,基本原理如下:

location / { 

 

    root /mnt/www; 

 

    index index.php index.html index.htm; 

 

    if (!-e $request_filename) { 

 

        rewrite ^/(\w+)(/)*$ /Index.php?__JJOModel__=$1&__JJOAction__=index last; 

 

        rewrite ^/(\w+)/(\w+)(/)*$ /Index.php?__JJOModel__=$1&__JJOAction__=$2 last; 

 

        rewrite ^/(\w+)/(\w+)/([0-9a-zA-z/_]+) /Index.php?_JJOModel__=$1&__JJOAction__=$2&UserParam=$3 last; 

 

        return 404;

 

  }

 
}

程序中的链接均http://os.jjonline.cn/Model/Action?para1=a&param2=b的形式;这样就达到了隐藏你的Index.php文件显示在用户地址栏中的目的了。如果有坑爹的人要问,实现这个有什么作用?哥笑而不语,自己去墙角想去~


好了,敲了不少字了,就这些,具体的原理说的太细也没啥意思。




----------------------------------



HTTP核心模块支持一些内置变量,变量名与apache里的对应。比如 $http_user_agent,$http_cookie等表示HTTP请求信息的变量。
更多变量:
$args, 请求中的参数;

$content_length, HTTP请求信息里的"Content-Length";

$content_type, 请求信息里的"Content-Type";

$document_root, 针对当前请求的根路径设置值;

$document_uri, 与$uri相同;

$host, 请求信息中的"Host",如果请求中没有Host行,则等于设置的服务器名;

$limit_rate, 对连接速率的限制;

$request_method, 请求的方法,比如"GET"、"POST"等;

$remote_addr, 客户端地址;

$remote_port, 客户端端口号;

$remote_user, 客户端用户名,认证用;

$request_filename, 当前请求的文件路径名

$request_body_file, ??

$request_uri, 请求的URI,带参数;

$query_string, 与$args相同;

$scheme, 所用的协议,比如http或者是https,比如rewrite  ^(.+)$  $scheme://example.com$1  redirect;

$server_protocol, 请求的协议版本,"HTTP/1.0"或"HTTP/1.1";

$server_addr, 服务器地址,如果没有用listen指明服务器地址,使用这个变量将发起一次系统调用以取得地址(造成资源浪费);

$server_name, 请求到达的服务器名;

$server_port, 请求到达的服务器端口号;

$uri, 请求的URI,可能和最初的值有不同,比如经过重定向之类的。