如果你服务器用的是Nginx的话,在开发的过程中,偶尔会出现 Nginx 502 Bad Gateway,那你会如何排查这种问题呢?
下面给大家总结了一些排查问题与解决方案,来看看吧!
Nginx 502错误情况1:
网站的访问量大,而php-cgi
的进程数偏少。
针对这种情况的502错误,只需增加php-cgi
的进程数。具体就是修改/usr/local/php/etc/php-fpm.conf
文件,将其中的max_children
值适当增加。这个数据要依据你的VPS或独立服务器的配置进行设置。一般一个php-cgi
进程占20M内存,你可以自己计算下,适量增多。
然后重启一下
/usr/local/php/sbin/php-fpm restart .
Nginx 502错误情况2:
CPU占用率、内存占用率非常高,遭到CC
攻击.
解决方法请参考:Linux VPS
简单解决CC
攻击
Nginx 502错误情况3:
CPU占用率不高,内存溢出。
检查一下网站程序有没有问题?一般小型站点常常会出现内存溢出。
检查一下/var/log/
目录下的日志,看看是不是有人爆破SSH
和FTP
端口?
SSH、FTP
遭到穷举也会占用大量内存。是的话改掉SSH
端口和FTP
端口即可
将网上找到的一些和502 Bad Gateway
错误有关的问题和排查方法列一下,先从FastCGI
配置入手:
1.查看FastCGI进程是否已经启动
NGINX 502错误的含义是sock
、端口没被监听造成的。我们先检查fastcgi
是否在运行
2.检查系统Fastcgi进程运行情况
除了第一种情况,fastcgi
进程数不够用、php执行时间长、或者是php-cgi
进程死掉也可能造成nginx的502错误
运行以下命令判断是否接近FastCGI
进程,如果fastcgi
进程数接近配置文件中设置的数值,表明worker
进程数设置太少
netstat -anpo | grep "php-cgi" | wc -l
3.FastCGI执行时间过长
根据实际情况调高以下参数值
fastcgi_connect_timeout 300;
fastcgi_send_timeout 300;
fastcgi_read_timeout 300;
4.头部太大
nginx
和apache
一样,有前端缓冲限制,可以调整缓冲参数
fastcgi_buffer_size 32k;
fastcgi_buffers 8 32k;
如果你使用的是nginx
的负载均衡Proxying
,调整
proxy_buffer_size 16k;
proxy_buffers 4 16k;
5.https转发配置错误*
正确的配置方法
server_name www.jb51.net; location /myproj/repos
{
set $fixed_destination $http_destination;
if ( $http_destination ~* ^https(.*)$ )
{
set $fixed_destination http$1;
}
proxy_set_header Host $host;
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header Destination $fixed_destination;
proxy_pass http://subversion_hosts;
}
6 max-children和max-requests
一台服务器上运行着nginx php(fpm) xcache
,访问量日均 300W pv左右
最近经常会出现这样的情况:php页面打开很慢,cpu使用率突然降至很低,系统负载突然升至很高,查看网卡的流量,也会发现突然降到了很低。这种情况只持续数秒钟就恢复了
检查php-fpm
的日志文件发现了一些线索:
Sep3008:32:23.289973[NOTICE] fpm_unix_init_main(), line 271: getrlimit(nofile): max:51200,cur:51200
Sep3008:32:23.290212[NOTICE] fpm_sockets_init_main(), line 371:using inherited socket fd=10,“127.0.0.1:9000″
Sep3008:32:23.290342[NOTICE] fpm_event_init_main(), line 109: libevent:using epoll
Sep3008:32:23.296426[NOTICE] fpm_init(), line 47: fpm is running, pid 30587
在这几句的前面,是1000多行的关闭children
和开启children
的日志
原来,php-fpm
有一个参数max_requests
,该参数指明了,每个children
最多处理多少个请求后便会被关闭,默认的设置是500。因为php是把请求轮询给每个children
,在大流量下,每个childre
到达max_requests
所用的时间都差不多,这样就造成所有的children
基本上在同一时间被关闭。
在这期间,nginx
无法将php文件转交给php-fpm
处理,所以cpu会降至很低(不用处理php,更不用执行sql),而负载会升至很高(关闭和开启children
、nginx
等待php-fpm
),网卡流量也降至很低(nginx
无法生成数据传输给客户端)
解决问题很简单,增加children
的数量,并且将 max_requests
设置未 0 或者一个比较大的值:
打开 /usr/local/php/etc/php-fpm.conf
调大以下两个参数(根据服务器实际情况,过大也不行
<valuename=”max_children”>5120</value>
<valuename=”max_requests”>600</value>
然后重启php-fpm
。
7、增加缓冲区容量大小
将nginx
的error log
打开,发现“pstream sent too big header while reading response header from upstream”
这样的错误提示。
查阅了一下资料,大意是nginx
缓冲区有一个bug
造成的,我们网站的页面消耗占用缓冲区可能过大。参考老外写的修改办法增加了缓冲区容量大小设置,502问题彻底解决。后来系统管理员又对参数做了调整只保留了2个设置参数:client head buffer
,fastcgi buffer size
。
8、request_terminate_timeout
如果主要是在一些post
或者数据库操作的时候出现502这种情况,而不是在静态页面操作中常见,那么可以查看一下php-fpm.conf
设置中的一项:request_terminate_timeout
这个值是max_execution_time
,就是fast-cgi
的执行脚本时间。
0s为关闭,就是无限执行下去。
发现问题解决了,执行很长时间也不会出错了。
优化fastcgi
中,还可以改改这个值为5s 看看效果。
php-cgi
进程数不够用、php执行时间长、或者是php-cgi
进程死掉,都会出现502错误。
上面总结的出现502的错误就这么多,更多的502问题在开发过程中需要大家去发现,然后最好是做更多的总结,总结经验!