在这样的环境中,绝大部分是php首先出现瓶颈,如果没有必要的监控就抓瞎了,下面是我们现在的做法:

1、在nginx里增加以下日志的记录
$request_time: nginx处理请求的时间
$upstream_response_time: php-cgi的响应时间

2、php-fpm加上慢请求的日志

3、使用xhprof来精准定位

其实通过1、2的日志,基本上可以确认问题所在了,使用xhprof当然就更完美了,在实际生产环境中,加上xhprof,貌似都是比较事后了(大部分情况下xhprof都不默认启动)。