问题是这样的,将项目部署到服务器上后,发现应用程序的响应速度非常慢,于是开始进行了排查。

TOP

首先查看系统资源占用信息,TOP看一下

记一次java程序CPU占用过高问题排查_16进制

发现正在运行的JAVA项目CPU占用率很高,百分之200左右了,那么问题一定出在这个程序中

 

 

Ps -mp pid -o THREAD,tid,time

 

再通过ps命令查看这个程序的线程信息,tid代码线程ID,time代表这个线程的已运行时间

由上面TOP可知进程ID为15669

记一次java程序CPU占用过高问题排查_问题排查_02

记一次java程序CPU占用过高问题排查_问题排查_03

 

于是可以看到这个进程中有3个线程的CPU占用率很高,并且它们目前也运行了13分钟了,它们的TID分别为16068,16069,16071

 

进制转换,2HEX

再将这3个TID转为16进制,为等会在jstack中查找方便

 

 

Printf “%x\n” number

记一次java程序CPU占用过高问题排查_JAVA_04

 

得到这三个数的16进制为别为3ec4,3ec5,3ec7

 

jstack查看进程信息

有了线程ID的16进制后,再在jstack中查看进程堆栈信息(之所有拿到TID信息,主要是为了查找方便)

通过jstack -pid 再grep查询

 

记一次java程序CPU占用过高问题排查_16进制_05

从这里能看出,这3个线程目前还处于运行状态的

再通过jstack查看详细点的信息

记一次java程序CPU占用过高问题排查_JAVA_06

记一次java程序CPU占用过高问题排查_JAVA_07

其中显示出了较为详细的代码信息

本地代码问题排查

再通过回到代码中查看getRemovedDateTypeParam方法

记一次java程序CPU占用过高问题排查_问题排查_08

仔细看了代码后,才发现了问题;此处的代码问题在于:如果paramMap不为空,但dateParamMap为空的,那么程序就会出现死循环。真是一个大BUG啊!

开发时大意了,没考虑到。

然后修改为以下代码:

记一次java程序CPU占用过高问题排查_问题排查_09

 

再测试下,打包上传后,程序终于正常了!

---------------------------

如果以后遇到类似的问题可以先按照上面这种思路进行查看:

  1. 通过jps -v找到对应的pid;
  2. 导出进程stack信息: jstack -l [pid] >> [文件名]
    eg:jstack -l 123456 >> 123.txt
  3. 打开导出的jstack文件进行查看,如果内容过多,也可以先通过一些jstack分析工具进行查看;

最后分享一个用于查看jstack文件的工具:

"IBM Thread and Monitor Dump Analyzer for Java" 下载地址:https://www.ibm.com/developerworks/community/groups/service/html/communityview?communityUuid=2245aa39-fa5c-4475-b891-14c205f7333c