在做运维工作时,或多或少都会遇到访问出错或缓慢问题,这里以两个小的例子来简单说明下这类问题的troubleshooting的思路。
nginx:80----------ip1/ip2 java------jdbc---(haproxy)--ip3(3000)+ip4(3000)hiveserver2---hdfs
!connect jdbc:hive2:/xxxx:30000/cdnlog
jstat -gcutil 14266 1000 1000 S0 S1 E O P YGC YGCT FGC FGCT GCT 100.00 0.00 100.00 100.00 21.65 596 77.267 629 2817.783 2895.050 100.00 0.00 100.00 100.00 21.65 596 77.267 629 2817.783 2895.050 100.00 0.00 100.00 100.00 21.65 596 77.267 629 2817.783 2895.050
截取的一段日志:"8.999, 0.008" "ip1:8081, ip2:8081" "502, 200" "9.007"