故障:最近收到生产服务器的报警短信以及邮件,报警内容为:内存使用率高于70%。

使用top命令查看系统资源的使用情况,命令:top

java进程内存超过xmm java进程内存占用_线程状态

如图可以看到java的进程内存使用率较高,java进程的内存使用率达到了70%+

2.定位线程问题(通过命令查看9718进程的线程情况),命令:ps p 9718 -L -o pcpu,pmem,pid,tid,time,tname,cmd

java进程内存超过xmm java进程内存占用_堆栈_02

由此可以看到这PID:9718的进程产生了很多线程。接下来就可以通过jstack查看内存使用的堆栈。

3. 查看内存使用的堆栈:在这里我们挑选了TID=9720的线程进行分析,首先需要将9731这个id转换为16进制。需输入如下命令,

printf "%x\n" 9731

java进程内存超过xmm java进程内存占用_java进程内存超过xmm_03

接下需要使用16进制的2603

4. 将PID为9718的堆栈信息打印到jstack.log中,命令:jstack -l 9718 > jstack.log

java进程内存超过xmm java进程内存占用_文件服务器内存高排查_04

5. 查看堆栈信息文件,命令:vim jstack.log

在进行搜索TID为2603的相关信息。如图:

java进程内存超过xmm java进程内存占用_文件服务器内存高排查_05

可以看到这个线程状态为:WAITING。通过查看文件分析看到大量Java Thread State。

说明它在等待另一个条件的发生,来把自己唤醒,或者干脆它是调用了 sleep(N)。

此时线程状态大致为以下几种:

java.lang.Thread.State: WAITING (parking):一直等那个条件发生;

java.lang.Thread.State: TIMED_WAITING (parking或sleeping):定时的,那个条件不到来,也将定时唤醒自己。

6.代码优化:将文件发送给开发。优化下线程