前言

     主动地健康检查,nignx定时主动地去ping后端的服务列表,当发现某服务出现异常时,把该服务从健康列表中移除,当发现某服务恢复时,又能够将该服务加回健康列表中。nginx自带的upstream轮询可以实现业务接口切换, nginx有一个开源的实现nginx_upstream_check_module模块能更加平滑的进行业务切换

nginx自带健康检查的缺陷:

  1. Nginx只有当有访问时后,才发起对后端节点探测。
  2. 如果本次请求中,节点正好出现故障,Nginx依然将请求转交给故障的节点,然后再转交给健康的节点处理。所以不会影响到这次请求的正常进行。但是会影响效率,因为多了一次转发
  3. 自带模块无法做到预警
  4. 被动健康检查

使用第三访模块nginx_upstream_check_module:

  1. 区别于nginx自带的非主动式的心跳检测,淘宝开发的tengine自带了一个提供主动式后端服务器心跳检测模块
  2. 若健康检查包类型为http,在开启健康检查功能后,nginx会根据设置的间隔向指定的后端服务器端口发送健康检查包,并根据期望的HTTP回复状态码来判断服务是否健康。
  3. 后端真实节点不可用,则请求不会转发到故障节点
  4. 故障节点恢复后,请求正常转发

本文介绍的nginx_upstream_check_module模块针对nginx1.2+

一、模块安装

1、nginx官方下载地址,下载版本然后用tar -zxvf解压nginx: download

nginx配置后端服务健康检查 nginx健康检查模块_linux

http://nginx.org/en/download.html

 2、nginx_upstream_check_module模块下载

wget https://codeload.github.com/yaoweibin/nginx_upstream_check_module/zip/master

unzip master

nginx配置后端服务健康检查 nginx健康检查模块_nginx_02

 3、加载nginx_upstream_check_module模块

进去下载nginx解压目录下运行如下打包命令,如果没有patch就yum inst all patch -y

注:不管是1.20.············都加载check_1.20.1+.patch,只看主版本号

 patch -p1 < ../nginx_upstream_check_module-master/check_1.20.1+.patch

nginx配置后端服务健康检查 nginx健康检查模块_linux_03

 4、编译安装nginx,注意各自模块的存放位置,

./configure --user=root --group=root --with-http_ssl_module --with-threads --with-file-aio --with-http_stub_status_module --add-module=/usr/local/src/nginx_upstream_check_module-master/

make && make install

二、nginx配置

我nginx的配置一般是单独include conf.d/*.conf;

vim /usr/local/nginx/conf/nginx.conf新增

nginx配置后端服务健康检查 nginx健康检查模块_服务器_04

[root@song ] cd /usr/local/nginx/conf/
[root@song conf]# mkdir conf.d

1、配置upstream.conf

项目部署目录/usr/local/tomcat1/webapps/ROOT/WEB-INF/下

探针文件放在/usr/local/tomcat1/webapps/ROOT/monitor/index.html

nginx配置后端服务健康检查 nginx健康检查模块_服务器_05

当检测不到index.html存在会自动切换到另外一台服务器,适用于Jenkins发版,后面会在Jenkins里进行补充 

upstream jenkins {    ip_hash;    server 192.168.2.251:8084;    server 192.168.2.252:8081;    check interval=3000 rise=2 fall=5 timeout=1000 type=http;    check_http_send "GET /monitor/index.html HTTP/1.0

";    check_http_expect_alive http_2xx http_3xx;}

interval检测间隔时间,单位为毫秒,rsie请求2次正常的话,标记此realserver的状态为up,fall表示请求5次都失败的情况下,标记此realserver的状态为down,timeout为超时时间,单位为毫秒。

2、 在server段里面可以加入查看realserver状态的页面

server {  listen 80;  server_name 192.168.2.251;location / {       proxy_pass http://jenkins;       proxy_set_header Host $http_host;       proxy_set_header X-Real-IP $remote_addr;       proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;    }location  /status {     check_status;     access_log off;     charset utf-8; }}

3、启动nginx

/usr/local/nginx/sbin/nginx -c /usr/local/nginx/conf/nginx.conf

4、查看nginx upstream状态

nginx配置后端服务健康检查 nginx健康检查模块_服务器_06

移除/usr/local/tomcat1/webapps/ROOT/monitor/index.html这个探针文件,在check status第5次的时候就会判断后端不可连而把连接都会转移到另外一台服务器,然后会根据上面设定的时间间隔向指定的后端服务器端口发送健康检查包,并根据期望的HTTP回复状态码来判断服务是否健康。这时候就可以对移除探针的服务器进行项目部署,让用户无感访问不受影响,部署完毕重新创建探针文件即可恢复

 

nginx配置后端服务健康检查 nginx健康检查模块_服务器_07

 server number是后端服务器的数量
generation是Nginx reload的次数
Index是服务器的索引
Upstream是在配置中upstream的名称
Name是服务器IP
Status是服务器的状态
Rise是服务器连续检查成功的次数
Fall是连续检查失败的次数
Check type是检查的方式
Check port是后端专门为健康检查设置的端口