此系列来自 http://freeloda.blog.51cto.com/2033581/1285722

1. nginx 配置文件结构

Nginx配置文件主要分为4部分:main(全局设置)、server(主机设置)、upstream(负载均衡服务器设置)和 location(URL匹配特定位置的设置)。main部分设置的指令将影响其他所有设置;server部分的指令主要用于指定主机和端口;upstream指令主要用于负载均衡,设置一系列的后端服务器;location部分用于匹配网页位置。这四者之间的关系如下:server继承main,location继承server,upstream既不会继承其他设置也不会被继承。如下图,

容器中nginx默认配置文件 nginx配置文件详解server_容器中nginx默认配置文件

在这4个部分当中,每个部分都包含若干指令,这些指令主要包含Nginx的主模块指令、事件模块指令、HTTP核心模块指令。同时每个部分还可以使用其他HTTP模块指令,例如Http SSL模块、Http Gzip Static模块和Http Addition模块等。

下面通过一个Nginx配置实例,详细介绍nginx.conf每个指令的含义。为了能更清楚地了解Nginx的结构和每个配置选项的含义,这里按照功能点将Nginx配置文件分为7个部分依次讲解。下面就围绕这7个部分进行介绍。


2. 配置文件详解


(1).Nginx 的全局配置文件


#user  nobody;          


         worker_processes  1;        


         #error_log  logs/error.log;          


         #error_log  logs/error.log  notice;           


         #error_log  logs/error.log  info;        


         #pid        logs/nginx.pid;        


         worker_rlimit_nofile 65535;         


         events {        


                  use epoll;        


                  worker_connections  1024;          


         }



上面这段代码中每个配置选项的含义解释如下:

  • user是个主模块指令,指定Nginx Worker进程运行用户以及用户组,默认由nobody账号运行。
  • worker_processes是个主模块指令,指定了Nginx要开启的进程数。每个Nginx进程平均耗费10MB~12MB内存。根据经验,一般指定一个进程足够了,如果是多核CPU,建议指定和CPU的数量一样多的进程数即可。(注,如果负载以CPU密集型应用为主,如SSL或压缩应用,则worker数应与CPU数相同;如果负载以IO密集型为主,如响应大量内容给客户端,则worker数应该为CPU个数的1.5或2倍。)
  • error_log是个主模块指令,用来定义全局错误日志文件。日志输出级别有debug、info、notice、warn、error、crit可供选择,其中,debug输出日志最为最详细,而crit输出日志最少。
  • pid是个主模块指令,用来指定进程id的存储文件位置。
  • worker_rlimit_nofile 用于绑定worker进程和CPU, Linux内核2.4以上可用。
  • events指令用来设定Nginx的工作模式及连接数上限。
  • use是个事件模块指令,用来指定Nginx的工作模式。Nginx支持的工作模式有select、poll、kqueue、epoll、rtsig和/dev/poll。其中select和poll都是标准的工作模式,kqueue和epoll是高效的工作模式,不同的是epoll用在Linux平台上,而kqueue用在BSD系统中。对于Linux系统,epoll工作模式是首选。
  • worker_connections也是个事件模块指令,用于定义Nginx每个进程的最大连接数,默认是1024。最大客户端连接数由worker_processes和worker_connections决定,即max_client=worker_processes*worker_connections,在作为反向代理时变为:max_clients = worker_processes * worker_connections/4。(注,进程的最大连接数受Linux系统进程的最大打开文件数限制,在执行操作系统命令“ulimit -n 65536”后worker_connections的设置才能生效。)

(2).HTTP服务器配置

注,接下来开始对HTTP服务器进行配置。下面这段内容是Nginx对HTTP服务器相关属性的配置,代码如下:

http {          


                  include       mime.types;           


                  default_type  application         /octet-stream         ;        


                  #log_format  main  '$remote_addr - $remote_user [$time_local] "$request" '          


                  #                  '$status $body_bytes_sent "$http_referer" '           


                  #                  '"$http_user_agent" "$http_x_forwarded_for"';        


                  #access_log  logs/access.log  main;        


                  sendfile        on;          


                  #tcp_nopush     on;        


                  #keepalive_timeout  0;          


                  keepalive_timeout  65;        


                  #gzip  on;



下面详细介绍这段代码中每个配置选项的含义。

  • include是个主模块指令,实现对配置文件所包含的文件的设定,可以减少主配置文件的复杂度。类似于Apache中的include方法。
  • default_type属于HTTP核心模块指令,这里设定默认类型为二进制流,也就是当文件类型未定义时使用这种方式,例如在没有配置PHP环境时,Nginx是不予解析的,此时,用浏览器访问PHP文件就会出现下载窗口。
  • log_format是Nginx的HttpLog模块指令,用于指定Nginx日志的输出格式。main为此日志输出格式的名称,可以在下面的access_log指令中引用。
  • client_max_body_size用来设置允许客户端请求的最大的单个文件字节数。
  • client_header_buffer_size用于指定来自客户端请求头的headerbuffer大小。对于大多数请求,1KB的缓冲区大小已经足够,如果自定义了消息头或有更大的cookie,可以增加缓冲区大小。这里设置为32KB。
  • large_client_header_buffers用来指定客户端请求中较大的消息头的缓存最大数量和大小, “4”为个数,“128K”为大小,最大缓存为4个128KB。
  • sendfile参数用于开启高效文件传输模式。将tcp_nopush和tcp_nodely两个指令设置为on,用于防止网络阻塞。
  • keepalive_timeout用于设置客户端连接保持活动的超时时间。在超过这个时间之后,服务器会关闭该连接。
  • client_header_timeout用于设置客户端请求头读取超时时间。如果超过这个时间,客户端还没有发送任何数据,Nginx将返回“Request time out(408)”错误。
  • client_body_timeout用于设置客户端请求主体读取超时时间,默认值为60。如果超过这个时间,客户端还没有发送任何数据,Nginx将返回“Request time out(408)”错误。
  • send_timeout用于指定响应客户端的超时时间。这个超时仅限于两个连接活动之间的时间,如果超过这个时间,客户端没有任何活动,Nginx将会关闭连接。
  • gzip用于设置开启或者关闭gzip模块,“gzip on”表示开启gzip压缩,实时压缩输出数据流

(3).HttpGzip模块配置

下面配置Nginx的HttpGzip模块。这个模块支持在线实时压缩输出数据流。要查看是否安装了此模块,需要使用下面的命令:


[root@web nginx-1.4.2] 
 # nginx -V   

 
 
 nginx version: nginx 
 /1 
 .4.2    

 
 
 built by gcc 4.4.7 20120313 (Red Hat 4.4.7-3) (GCC)    

 
 
 TLS SNI support enabled    

 
 
 configure arguments: --prefix= 
 /usr  
 --sbin-path= 
 /usr/sbin/nginx  

 
 
 --conf-path= 
 /etc/nginx/nginx 
 .conf --error-log-path= 
 /var/log/nginx/error 
 .log  

 
 
 --http-log-path= 
 /var/log/nginx/access 
 .log --pid-path= 
 /var/run/nginx/nginx 
 .pid  

 
 
 --lock-path= 
 /var/lock/nginx 
 .lock --user=nginx --group=nginx --with-http_ssl_module  

 
 
 --with-http_flv_module --with-http_stub_status_module --with-http_gzip_static_module  

 
 
 --http-client-body-temp-path= 
 /var/tmp/nginx/client/  
 --http-proxy-temp-path= 
 /var/tmp/nginx/proxy/  

 
 
 --http-fastcgi-temp-path= 
 /var/tmp/nginx/fcgi/  
 --http-uwsgi-temp-path= 
 /var/tmp/nginx/uwsgi 

 

    
 --http-scgi-temp-path= 
 /var/tmp/nginx/scgi  
 --with-pcre


通过nginx -V 命令可以查看安装Nginx时的编译选项。由输出可知,我们已经安装了HttpGzip模块。下面是HttpGzip模块在Nginx配置中的相关属性设置:


#gzip  on;        


         #gzip_min_length  1k;        


         #gzip_buffers     4  16k;        


         #gzip_http_version  1.1;        


         #gzip_comp_level  2;        


         #gzip_types  text/plain application/x-javascript text/css application/xml;        


         #gzip_vary  on;



  • gzip用于设置开启或者关闭gzip模块,“gzip on”表示开启gzip压缩,实时压缩输出数据流。
  • gzip_min_length用于设置允许压缩的页面最小字节数,页面字节数从header头的Content-Length中获取。默认值是0,不管页面多大都进行压缩。建议设置成大于1K的字节数,小于1K可能会越压越大。
  • gzip_buffers表示申请4个单位为16K的内存作为压缩结果流缓存,默认值是申请与原始数据大小相同的内存空间来存储gzip压缩结果。
  • gzip_buffers表示申请4个单位为16K的内存作为压缩结果流缓存,默认值是申请与原始数据大小相同的内存空间来存储gzip压缩结果。
  • gzip_comp_level用来指定gzip压缩比,1 压缩比最小,处理速度最快;9 压缩比最大,传输速度快,但处理最慢,也比较消耗CPU资源。
  • gzip_types用来指定压缩的类型,无论是否指定,“text/html”类型总是会被压缩的。
  • gzip_vary选项可以让前端的缓存服务器缓存经过gzip压缩的页面,例如,用Squid缓存经过Nginx压缩的数据。

(4).负载均衡配置

下面设定负载均衡的服务器列表。


upstream          test         .net{        


         ip_hash;        


         server 192.168.10.13:80;        


         server 192.168.10.14:80  down;        


         server 192.168.10.15:8009  max_fails=3  fail_timeout=20s;        


         server 192.168.10.16:8080weight;        


         }



  • upstream是Nginx的HTTP Upstream模块,这个模块通过一个简单的调度算法来实现客户端IP到后端服务器的负载均衡。在上面的设定中,通过upstream指令指定了一个负载均衡器的名称test.net。这个名称可以任意指定,在后面需要用到的地方直接调用即可。
  • Nginx的负载均衡模块目前支持4种调度算法,下面进行分别介绍,其中后两项属于第三方调度算法。      
  • 轮询(默认)。每个请求按时间顺序逐一分配到不同的后端服务器,如果后端某台服务器宕机,故障系统被自动剔除,使用户访问不受影响。
  • Weight。指定轮询权值,Weight值越大,分配到的访问机率越高,主要用于后端每个服务器性能不均的情况下。
  • ip_hash。每个请求按访问IP的hash结果分配,这样来自同一个IP的访客固定访问一个后端服务器,有效解决了动态网页存在的session共享问题。
  • fair。这是比上面两个更加智能的负载均衡算法。此种算法可以依据页面大小和加载时间长短智能地进行负载均衡,也就是根据后端服务器的响应时间来分配请求,响应时间短的优先分配。Nginx本身是不支持fair的,如果需要使用这种调度算法,必须下载Nginx的upstream_fair模块。
  • url_hash。此方法按访问url的hash结果来分配请求,使每个url定向到同一个后端服务器,可以进一步提高后端缓存服务器的效率。Nginx本身是不支持url_hash的,如果需要使用这种调度算法,必须安装Nginx 的hash软件包。
  • 在HTTP Upstream模块中,可以通过server指令指定后端服务器的IP地址和端口,同时还可以设定每个后端服务器在负载均衡调度中的状态。常用的状态有:      
  • down,表示当前的server暂时不参与负载均衡。
  • backup,预留的备份机器。当其他所有的非backup机器出现故障或者忙的时候,才会请求backup机器,因此这台机器的压力最轻。
  • max_fails,允许请求失败的次数,默认为1。当超过最大次数时,返回proxy_next_upstream 模块定义的错误。
  • fail_timeout,在经历了max_fails次失败后,暂停服务的时间。max_fails可以和fail_timeout一起使用。

注意,当负载调度算法为ip_hash时,后端服务器在负载均衡调度中的状态不能是weight和backup。



(5).server虚拟主机配置

下面介绍对虚拟主机的配置。建议将对虚拟主机进行配置的内容写进另外一个文件,然后通过include指令包含进来,这样更便于维护和管理。

server{        


         listen         80;        


         server_name    192.168.12.188  www.         test         .net;        


         index index.html index.htm index.php;        


         root           /web/www/www         .         test         .net        


         charset gb2312;        


         access_log  logs         /www         .         test         .net.access.log  main;



  • server标志定义虚拟主机开始;
  • listen用于指定虚拟主机的服务器端口;
  • server_name用来指定IP地址或者域名,多个域名之间用空格分开;
  • index用于设定访问的默认首页地址;
  • root指令用于指定虚拟主机的网页根目录,这个目录可以是相对路径,也可以是绝对路径;
  • charset用于设置网页的默认编码格式。
  • access_log用来指定此虚拟主机的访问日志存放路径。最后的main用于指定访问日志的输出格式。

server { 

         listen       80; 

         server_name  127.0.0.1; 

         charset utf-8; 

         access_log  logs/host.access.log  main; 

location / { 

proxy_pass http://127.0.0.1:8080; 

proxy_set_header Host $host:80; 

proxy_set_header Via "nginx"; 

 
}

(6).URL匹配配置

URL地址匹配是Nginx配置中最灵活的部分。 location支持正则表达式匹配,也支持条件判断匹配,用户可以通过location指令实现Nginx对动、静态网页的过滤处理。

格式:location [ = | ~ | ~* | ^~ ] uri { ... }

  • location URI {}:对当前路径及子路径下的所有对象都生效;
  • location = URI {}:精确匹配指定的路径,不包括子路径,因此,只对当前资源生效;
  • location ~ URI {},location ~* URI {}:模式匹配URI,此处的URI可使用正则表达式,~区分字符大小写,~*不区分字符大小写;
  • location ^~ URI {}:不使用正则表达式

案例1:


location ~ .*\.(gif|jpg|jpeg|png|bmp|swf)$  {        


                  root             /web/www/www         .         test         .net;        


                  expires 30d;        


                  }



说明:上面这段设置是通过location指令来对网页URL进行分析处理,所有扩展名为.gif、.jpg、.jpeg、.png、.bmp、.swf的静态文件都交给Nginx处理,而expires用来指定静态文件的过期时间,这里是30天。

案例2:


location ~ ^/(upload|html)/  {        


                  root             /web/www/www         .         test         .net;        


                  expires 30d;        


         }



说明:上面这段设置是将upload和html下的所有文件都交给Nginx来处理,当然,upload和html目录包含/web/www/www.test.net目录中。

案例3:


location ~ .*.jsp$ {        


                  index index.jsp;        


                  proxy_pass http:         //localhost         :8080;        


                  }



说明:在最后这段设置中,location是对此虚拟主机下动态网页的过滤处理,也就是将所有以.jsp为后缀的文件都交给本机的8080端口处理。

location [ = | ~ | ~* | ^~ ] 优先级

  • location = URI {}:精确匹配指定的路径,不包括子路径,因此,只对当前资源生效;(优先级最高)
  • location ^~ URI {}:不使用正则表达式;(优先级次之)
  • location ~ URI {},location ~* URI {}:模式匹配URI,此处的URI可使用正则表达式,~区分字符大小写,~*不区分字符大小写;(优先级次之)
  • location URI {}:对当前路径及子路径下的所有对象都生效;(优先级最低)

案例:

location = / {  
     [ configuration A ]
}
location / {  
     [ configuration B ]
}
location /documents/ {
     [ configuration C ]
}
location ^~ /images/
{  
     [ configuration D ]
}
location ~* \.(gif|jpg|jpeg)$ {  
     [ configuration E ]
}



说明:The “/” request will match configuration A, the “/index.html” request will match configuration B, the “/documents/document.html” request will match configuration C, the “/images/1.gif” request will match configuration D, and the “/documents/1.jpg” request will match configuration E.