Nginx一般为开箱即用, 除了nginx.conf,其余配置文件,一般只需要使用默认提供即可。

Nginx文件结构

#全局块
worker_process      # 表示工作进程的数量,一般设置为cpu的核数
worker_connections  # 表示每个工作进程的最大连接数           

events {}         #events块

http      #http块
{
	keepalive_timeout #连接超时时间
    server        #server块
    { 
        listen          # 监听端口
    	server_name     # 监听域名
        location [PATTERN]  #location块
        {
			root        # 指定对应uri的资源查找路径,这里html为相对路径
			index       # 指定首页index文件的名称,可以配置多个,以空格分开。如有多个,按配置顺序查找。
		}
    }
}
  • 全局块:配置影响nginx全局的指令。 一般有运行nginx服务器的用户组,nginx进程pid存放路径,日志存放路径,配置文件引入,允许生成worker process数等。
  • events块:配置影响nginx服务器或与用户的网络连接。 有每个进程的最大连接数,选取哪种事件驱动模型处理连接请求,是否允许同时接受多个网路连接,开启多个网络连接序列化等。
  • http块:可以嵌套多个server,配置代理,缓存,日志定义等绝大多数功能和第三方模块的配置。 如文件引入,mime-type定义,日志自定义,是否使用sendfile传输文件,连接超时时间,单连接请求数等。
  • server块:配置虚拟主机的相关参数,一个http中可以有多个server。
  • location块:配置请求的路由,以及各种页面的处理情况。

配置示例

每个指令必须有分号结束

#user administrator administrators;  #配置用户或者组,默认为nobody nobody。
#worker_processes 2;  #允许生成的进程数,默认为1
#pid /nginx/pid/nginx.pid;   #指定nginx进程运行文件存放地址
error_log log/error.log debug;  #制定日志路径,级别。这个设置可以放入全局块,http块,server块,级别以此为:debug|info|notice|warn|error|crit|alert|emerg
events {
    accept_mutex on;   #设置网路连接序列化,防止惊群现象发生,默认为on
    multi_accept on;  #设置一个进程是否同时接受多个网络连接,默认为off
    #use epoll;      #事件驱动模型,select|poll|kqueue|epoll|resig|/dev/poll|eventport
    worker_connections  1024;    #最大连接数,默认为512
}
http {
    include       mime.types;   #文件扩展名与文件类型映射表
    default_type  application/octet-stream; #默认文件类型,默认为text/plain
    #access_log off; #取消服务日志    
    log_format  my_log '"$http_x_forwarded_for" $remote_addr - $remote_user [$time_local] "$request" $status $body_bytes_sent $request_time $upstream_response_time "$http_referer" "$http_user_agent" "$scheme"'; #自定义日志格式

    sendfile on;   #允许sendfile方式传输文件,默认为off,可以在http块,server块,location块。
    sendfile_max_chunk 100k;  #每个进程每次调用传输数量不能大于设定的值,默认为0,即不设上限。
    keepalive_timeout 65;  #连接超时时间,默认为75s,可以在http,server,location块。

    upstream webservers {   
      server 127.0.0.1:8001;
      server 192.168.1.1:8001 backup;  #热备
    }
    
    error_page 404 @page_not_found; #错误页
    server {
        keepalive_requests 120; #单连接请求上限次数。
        listen       80; #监听端口
        listen 443 ssl;
        ssl on;
        ssl_certificate         /data/var/example.com.crt;
        ssl_certificate_key     /data/var/example.com.key;
        server_name  www.exapmle.com;   #监听地址       
        access_log /data/weblog/nginx/access.log my_log;  #combined为日志格式的默认值

        location  ~*^.+$ {       #请求的url过滤,正则匹配,~为区分大小写,~*为不区分大小写。
           proxy_pass  http://webservers;  #请求转向upstream定义的服务器列表
           deny 127.0.0.1;  #拒绝的ip
           allow 192.168.1.1; #允许的ip           
        } 

        location ~ \.(html)$ {
            root   /data/webapps/static/; #根目录
            index  index.html index.htm;  #设置默认页
            concat on;
        }

		location @page_not_found {
			proxy_set_header Host $host;
			proxy_pass http://webservers;
			error_page 404 = /404.html;
		}
    }
}

Nginx常用内置绑定变量

Nginx基础语法

upstream

HTTP Upstream模块中,可以通过 server 指令指定后端服务器的 IP 地址和端口,同时还可以设定每个后端服务器在负载均衡调度中的状态。常用的状态有:

  • down:表示当前的 server 暂时不参与负载均衡。
  • backup:预留的备份机器。当其他所有的非 backup 机器出现故障或者忙的时候,才会请求 backup 机器,因此这台机器的压力最轻。
  • max_fails:允许请求失败的次数,默认为 1 。当超过最大次数时,返回 proxy_next_upstream 模块定义的错误。
  • fail_timeout:在经历了 max_fails 次失败后,暂停服务的时间。max_fails 可以和 fail_timeout 一起使用。

当负载调度算法为ip_hash时,后端服务器在负载均衡调度中的状态不能是backup

配置示例:

upstream webservers {
    server 192.168.18.201 weight=1 max_fails=2 fail_timeout=2;
    server 192.168.18.202 weight=2 max_fails=2 fail_timeout=2;
    server 192.168.18.203 down;
    server 127.0.0.1:8080 backup;
}

上述配置中192.168.18.203不参与负载均衡,127.0.0.1:8080为备机,根据该权重配置,nginx配置过滤字符 nginx配置语法_基础语法的请求量会到192.168.18.202,另外nginx配置过滤字符 nginx配置语法_nginx_02的请求量会到192.168.18.201

upstream支持的负载均衡算法见负载均衡

rewrite

rewrite 语法

  • last – 发起一个新的请求,再次进入server块,重试location匹配
  • break – 中止 rewrite,不再继续匹配
  • redirect – 返回临时重定向的 HTTP 状态 302
  • permanent – 返回永久重定向的 HTTP 状态 301

如果location中rewrite后是对静态资源的请求,不需要再进行其他匹配,一般要使用break或不写,直接使用当前location中的数据源,完成本次请求
如果location中rewrite后,还需要进行其他处理,如动态fastcgi请求(.php,.jsp)等,要用last继续发起新的请求

配置示例:

server {
    listen 80;
    server_name www.example.com;
    index index.html index.htm;
    root html;
    if ($http_host !~ "^www\.example\.cn$") {
        rewrite ^(.*) http://www.example.com$1 redirect;
    }
    
	rewrite ^/web$ /web_static/index.html last;
    rewrite ^/watch/index.htm$ $scheme://www.example.com/watch permanent;
    
    location ^~ /web_static/ {
         rewrite ^/web_static/([\S]+) /$1 break;
         proxy_set_header Host web.example.com;
         proxy_set_header Remote-Host http://www.example.com;
         proxy_set_header X-Real-IP $remote_addr;
         proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
         proxy_pass https://web.example.com/;
         proxy_http_version 1.1;
         error_page 404 = @page_not_found;
     }
     
     location ^~ /html/ {
         root  /data/webapps/static/;
         try_files /read/$uri /back/$uri @page_not_found;
     }
}
费力的rewrites

不要知难而退,rewrite 很容易和正则表达式混为一谈。 实际上,rewrite 是很容易的,我们应该努力去保持它们的整洁。 很简单,不添加冗余代码就行了。

糟糕的配置:

rewrite ^/(.*)$ http://example.com/$1 permanent;

好点儿的配置:

rewrite ^ http://example.com$request_uri? permanent;

更好的配置:

return 301 http://example.com$request_uri;

反复对比下这几个配置。 第一个 rewrite 捕获不包含第一个斜杠的完整 URI。 使用内置的变量 $request_uri,我们可以有效的完全避免任何捕获和匹配。


参考资料:

  1. Nginx wiki
  2. Pitfalls and Common Mistakes
  3. Nginx 内置绑定变量
  4. Nginx 陷阱和常见错误
  5. Full Example Configuration