Nginx 教程

Nginx(engine x)由俄罗斯 lgor Sysoev 设计开发,是一款轻量级的、开源的、占用内存少、并发能力强、高性能的 WEB 服务器和反向代理服务器;同时也是一个 IMAP、POP3、SMTP 邮件代理服务器,采用事件驱动的异步非阻塞处理方式框架,这让其具有极好的IO性能。

正向代理

可以通过第三方服务器访问目标服务器,第三方服务器一般叫做 proxy 服务器。

比如:国外一些网站通过浏览器是无法正常访问,使用一些软件找到一个可以访问这些网站的代理服务器。

这种代理模式称为正向代理,正向代理最大的特点是客户端非常明确要访问的服务器地址;服务器只清楚请求来自哪个代理服务器,而不清楚来自哪个具体的客户端;正向代理模式屏蔽或者隐藏了真实客户端信息。

反向代理

客户端发送的请求,发送到代理服务器上,这个代理服务器再把请求发送到自己内部服务器上。

反向代理,只暴露代理服务器地址,客户端只能访问代理服务器,并不知道自己访问的是那台真实服务器,可以很好的提供安全保护。

负载均衡

反向代理的主要用途是为多个服务器提供负载均衡、缓存等功能。负载均衡就是一个网站的内容被部署在若干服务器上,可以把这些机子看成一个集群,Nginx 可以将接收到的客户端请求“均匀地”分配到这个集群中所有的服务器上,从而实现服务器压力的平均分配,也叫负载均衡。

例如:淘宝网,单个服务器已经不能满足用户的需求,升级服务器配置,单纯从硬件提升性能已经不可取了,怎么解决这种需求呢?增加服务器的数量,构建集群,将请求分发到各个服务器上,分布式部署,也就是通过部署多台服务器来解决访问人数限制的问题,大部分是使用 Nginx 反向代理来实现。

我们在实际项目操作时,正向代理和反向代理很有可能会存在在一个应用场景中,正向代理代理客户端的请求去访问目标服务器,目标服务器是一个反向代理服务器,反向代理了多台真实的业务处理服务器。具体的拓扑图如下:

Nginx 教程_Nginx


Nginx 扮演了反向代理服务器的角色,它是以依据什么样的规则进行请求分发的呢?

客户端发送的、Nginx 反向代理服务器接收到的请求数量,就是负载量。

请求数量按照一定的规则分发到不同的服务器处理,就是一种均衡规则,所以服务器接收到的请求按照规则分发的过程,称为负载均衡。

负载均衡有硬件负载均衡和软件负载均衡两种,硬件负载均衡也称为硬负载,相对造价昂贵成本较高,但是数据的稳定性、安全性等等有非常好的保障,如中国移动中国联通这样的公司才会选择硬负载进行操作;更多的公司考虑到成本原因,会选择使用软件负载均衡,软件负载均衡是利用现有的技术结合主机硬件实现的一种消息队列分发机制。

Nginx 支持的负载均衡调度算法方式如下:

weight 轮询(默认):接收到的请求按照顺序逐一分配到不同的后端服务器,即使在使用过程中,某一台后端服务器宕机,Nginx 会自动将该服务器剔除出队列,请求受理情况不会受到任何影响。 这种方式下,可以给不同的后端服务器设置一个权重值(weight),用于调整不同的服务器上请求的分配率;权重数据越大,被分配到请求的几率越大;该权重值,主要是针对实际工作环境中不同的后端服务器硬件配置进行调整的。
ip_hash:每个请求按照发起客户端的 ip 的 hash 结果进行匹配,这样的算法下一个固定 ip 地址的客户端总会访问到同一个后端服务器,这也在一定程度上解决了集群部署环境下 session 共享的问题。
fair:智能调整调度算法,动态的根据后端服务器的请求处理到响应的时间进行均衡分配,响应时间短处理效率高的服务器分配到请求的概率高,响应时间长处理效率低的服务器分配到的请求少;结合了前两者的优点的一种调度算法。Nginx 默认不支持 fair 算法,需要安装 upstream_fair 模块。
url_hash:按照访问的 url 的 hash 结果分配请求,每个请求的 url 会指向后端固定的某个服务器,可以在 Nginx 作为静态服务器的情况下提高缓存效率。Nginx 默认不支持这种调度算法,需要安装Nginx 的 hash 软件包。

动静分离

为了加快网站的解析速度,可以把动态页面和静态页面交给不同的服务器来解析,加快解析的速度,降低由单个服务器的压力。

Nginx 教程_负载均衡_02

启动,停止和重新加载配置

一旦启动nginx,就可以通过使用 -s 参数调用可执行文件来对其进行控制。

1、启动

[sudo] nginx

在 Ubuntu 下,nginx 主进程的进程 ID 写入 nginx.pid 目录 /run 或中的 /var/run。

2、停止

[sudo] nginx -s quit  # 正常关机,等待工作进程完成 。
[sudo] nginx -s stop  # 快速关机

3、重新加载配置文件

[sudo] nginx -s reload # 重新加载配置文件

4、重新打开日志文件

[sudo] nginx -s reopen # 重新打开日志文件

reload 和 reopen 是 nginx 启动之后,重新加载配置文件或重新打开日志文件时使用。nginx 停止以后,无法使用。

5、查询 Nginx 进程的列表

ps ax | grep nginx
ps -ef | grep nginx

Nginx 教程_nginx_03


Nginx 进程在启动的时候,会附带一个守护进程,用于保护正式进程不被异常终止;如果守护进程一旦返现 Nginx 继承被终止了,会自动重启该进程。

守护进程一般会称为 master 进程,业务进程被称为 worker 进程。

Nginx配置

三个核心功能是反向代理、负载均衡和静态服务器。

Nginx.conf 配置文件

主要是设置一些影响 Nginx 服务器整体运行的配置指令。

main # 全局配置
events { # Nginx 工作模式配置}
http {  # http 设置  ....
    server { # 服务器主机配置 ....
        location { # 路由配置   ....  }
        location path {  .... }
        location otherpath {  ....  }
    }
    server {   ....
        location {  .... }
    }
    upstream name { # 负载均衡配置   ....    }
}

主要由6个部分组成:

main:用于进行Nginx全局信息的配置
events:用于Nginx工作模式的配置
http:用于进行http协议信息的一些配置
server:用于进行服务器访问信息的配置
location:用于进行访问路由的配置
upstream:用于进行负载均衡的配置

main 模块

user nobody nobody;
worker_processes 2;
error_log logs/error.log;
error_log logs/error.log notice;
error_log logs/error.log info;
pid logs/Nginx.pid
worker_rlimit_nofile 1024;

user 用来指定 Nginx worker 进程运行用户以及用户组,默认 nobody 账号运行;
worker_processes 指定 Nginx 要开启的子进程数量,运行过程中监控每个进程消耗内存(一般几M~几十M不等)根据实际情况进行调整,通常数量是CPU 内核数量的整数倍;
error_log 定义错误日志文件的位置及输出级别【debug / info / notice / warn / error / crit】;
pid 用来指定进程 id 的存储文件的位置;
worker_rlimit_nofile 用于指定一个进程可以打开最多文件数量的描述;

event 模块

event {
    worker_connections 1024;
    multi_accept on;
}

worker_connections 指定最大可以同时接收的连接数量,这里一定要注意,最大连接数量是和 worker processes 共同决定的。
multi_accept 配置指定 Nginx 在收到一个新连接通知后尽可能多的接受更多的连接;

http 模块

作为 web 服务器,http 模块是 Nginx 最核心的一个模块,配置项也是比较多的,项目中会设置到很多的实际业务场景,需要根据硬件信息进行适当的配置,常规情况下,使用默认配置即可!

http {
	### 基础配置##    
	sendfile on;
    tcp_nopush on;
    tcp_nodelay on;
    keepalive_timeout 65;
    types_hash_max_size 2048;
	# server_tokens off;
	# server_names_hash_bucket_size 64;
	# server_name_in_redirect off;    
	include /etc/Nginx/mime.types;
    default_type application/octet-stream;
    ### SSL证书配置 ##    
    ssl_protocols TLSv1 TLSv1.1 TLSv1.2;
    # Dropping SSLv3, ref: POODLE    ssl_prefer_server_ciphers on;
    ### 日志配置##    
    access_log /var/log/Nginx/access.log;
    error_log /var/log/Nginx/error.log;
    ### Gzip 压缩配置##    
    gzip on;
    gzip_disable "msie6";
    # gzip_vary on;
    # gzip_proxied any;
    # gzip_comp_level 6;
    # gzip_buffers 16 8k;
    # gzip_http_version 1.1;
    # gzip_types text/plain text/css application/json application/javascripttext/xml application/xml application/xml+rss text/javascript;
    ### 虚拟主机配置##    
    include /etc/Nginx/conf.d/*.conf;
    include /etc/Nginx/sites-enabled/*;
1) 基础配置

sendfile on:配置 on 让 sendfile 发挥作用,将文件的回写过程交给数据缓冲去完成,而不是放在应用中完成,这样的话在性能提升有有好处
tcp_nopush on:让 Nginx 在一个数据包中发送所有的头文件,而不是一个一个单独发
tcp_nodelay on:让 Nginx 不要缓存数据,而是一段一段发送,如果数据的传输有实时性的要求的话可以配置它,发送完一小段数据就立刻能得到返回值,但是不要滥用哦
keepalive_timeout 10:给客户端分配连接超时时间,服务器会在这个时间过后关闭连接。一般设置时间较短,可以让 Nginx 工作持续性更好
client_header_timeout 10:设置请求头的超时时间
client_body_timeout 10: 设置请求体的超时时间
send_timeout 10:指定客户端响应超时时间,如果客户端两次操作间隔超过这个时间,服务器就会关闭这个链接
limit_conn_zone $binary_remote_addr zone=addr:5m :设置用于保存各种key的共享内存的参数,
limit_conn addr 100: 给定的 key 设置最大连接数
server_tokens:虽然不会让 Nginx 执行速度更快,但是可以在错误页面关闭Nginx版本提示,对于网站安全性的提升有好处哦
include /etc/Nginx/mime.types:指定在当前文件中包含另一个文件的指令
default_type application/octet-stream:指定默认处理的文件类型可以是二进制
type_hash_max_size 2048:混淆数据,影响三列冲突率,值越大消耗内存越多,散列key冲突率会降低,检索速度更快;值越小 key,占用内存较少,冲突率越高,检索速度变慢

2) 日志配置

access_log logs/access.log:设置存储访问记录的日志
error_log logs/error.log:设置存储记录错误发生的日志

3) SSL证书加密

ssl_protocols:指令用于启动特定的加密协议,Nginx 在1.1.13和1.0.12版本后默认是 ssl_protocols SSLv3 TLSv1 TLSv1.1 TLSv1.2,TLSv1.1与TLSv1.2 要确保 OpenSSL >= 1.0.1 ,SSLv3 现在还有很多地方在用但有不少被攻击的漏洞。
ssl prefer server ciphers:设置协商加密算法时,优先使用我们服务端的加密套件,而不是客户端浏览器的加密套件

4) 压缩配置

gzip 是告诉 Nginx 采用 gzip 压缩的形式发送数据。这将会减少我们发送的数据量。
gzip_disable 为指定的客户端禁用 gzip 功能。我们设置成 IE6 或者更低版本以使我们的方案能够广泛兼容。
gzip_static 告诉 Nginx 在压缩资源之前,先查找是否有预先 gzip 处理过的资源。这要求你预先压缩你的文件(在这个例子中被注释掉了),从而允许你使用最高压缩比,这样 Nginx 就不用再压缩这些文件了(想要更详尽的gzip_static 的信息,请点击这里)。
gzip_proxied 允许或者禁止压缩基于请求和响应的响应流。我们设置为any,意味着将会压缩所有的请求。
gzip_min_length 设置对数据启用压缩的最少字节数。如果一个请求小于1000字节,我们最好不要压缩它,因为压缩这些小的数据会降低处理此请求的所有进程的速度。
gzip_comp_level 设置数据的压缩等级。这个等级可以是1-9之间的任意数值,9是最慢但是压缩比最大的。我们设置为4,这是一个比较折中的设置。
gzip_type 设置需要压缩的数据格式。上面例子中已经有一些了,你也可以再添加更多的格式。

5) 文件缓存配置

open_file_cache 打开缓存的同时也指定了缓存最大数目,以及缓存的时间。我们可以设置一个相对高的最大时间,这样我们可以在它们不活动超过20秒后清除掉。
open_file_cache_valid 在 open_file_cache 中指定检测正确信息的间隔时间。
open_file_cache_min_uses 定义了 open_file_cache 中指令参数不活动时间期间里最小的文件数。
open_file_cache_errors 指定了当搜索一个文件时是否缓存错误信息,也包括再次给配置中添加文件。我们也包括了服务器模块,这些是在不同文件中定义的。如果你的服务器模块不在这些位置,你就得修改这一行来指定正确的位置。

server 模块

srever 模块配置是 http 模块中的一个子模块,用来定义一个虚拟访问主机,也就是一个虚拟服务器的配置信息

server {
    listen  80;
    server_name localhost  192.168.1.100;
    root   /Nginx/www;
    index   index.php index.html index.html;
    charset   utf-8;
    access_log  logs/access.log;
    error_log   logs/error.log;
    ......
}

核心配置信息如下:
server:一个虚拟主机的配置,一个 http 中可以配置多个 server
server_name:指定ip地址或者域名,多个配置之间用空格分隔
root:表示整个 server 虚拟主机内的根目录,所有当前主机中 web 项目的根目录
index:用户访问 web 网站时的全局首页
charset:用于设置 www/ 路径中配置的网页的默认编码格式
access_log:用于指定该虚拟主机服务器中的访问记录日志存放路径
error_log:用于指定该虚拟主机服务器中访问错误日志的存放路径

location 模块

location 模块是 Nginx 配置中出现最多的一个配置,主要用于配置路由访问信息
在路由访问信息配置中关联到反向代理、负载均衡等等各项功能,所以location 模块也是一个非常重要的配置模块

基本配置
location / {
    root    /Nginx/www;
    index    index.php index.html index.htm;
}

location /:表示匹配访问根目录
root:用于指定访问根目录时,访问虚拟主机的web目录
index:在不指定访问具体资源时,默认展示的资源文件列表
=:用于不含正则表达式的 url 前,要求字符串与 url 严格匹配,匹配成功就停止向下搜索并处理请求。
~:用于表示 url 包含正则表达式,并且区分大小写。
~:*用于表示 url 包含正则表达式,并且不区分大小写。
^~:用于不含正则表达式的 url 前,要求 Nginx 服务器找到表示 url 和字符串匹配度最高的 location 后,立即使用此 location 处理请求,而不再匹配。
如果有 url 包含正则表达式,不需要有 ~ 开头标识。

反向代理配置方式

通过反向代理代理服务器访问模式,通过 proxy_set 配置让客户端访问透明化

location / {
    proxy_pass http://localhost:8888;
    proxy_set_header X-real-ip $remote_addr;
    proxy_set_header Host $http_host;
}

uwsgi 配置

wsgi 模式下的服务器配置访问方式

location / {
    include uwsgi_params;
	uwsgi_pass localhost:8888
}

upstream 模块

upstream 模块主要负责负载均衡的配置,通过默认的轮询调度方式来分发请求到后端服务器。

简单的配置方式如下

upstream name {
    ip_hash;
    server 192.168.1.100:8000;
    server 192.168.1.100:8001 down;
    server 192.168.1.100:8002 max_fails=3;
    server 192.168.1.100:8003 fail_timeout=20s;
    server 192.168.1.100:8004 max_fails=3 fail_timeout=20s;
}

核心配置信息如下

ip_hash:指定请求调度算法,默认是 weight 权重轮询调度,可以指定
server host:port:分发服务器的列表配置
– down:表示该主机暂停服务
– max_fails:表示失败最大次数,超过失败最大次数暂停服务
– fail_timeout:表示如果请求受理失败,暂停指定的时间之后重新发起请求

负载均衡方式如下:

• 轮询(默认)。
• weight,代表权,权越高优先级越高。
• fair,按后端服务器的响应时间来分配请求,相应时间短的优先分配。
• ip_hash,每个请求按照访问 ip 的 hash 结果分配,这样每一个访客固定的访问一个后端服务器,可以解决 Session 的问题。