简介

说明

        本文介绍Java进程突然不见了的原因及排查步骤。

        Java进程突然消失一般是通过以下几个途径发现的:

  1. 页面无法打开,返回404
  2. 应用监控系统报警

Java进程消失原因

  1. Java应用程序的问题:发生OOM导致进程Crash
  2. 被操作系统OOM-Killer
  3. JVM出错:JVM或JDK自身的Bug导致进程Crash

原因及排查方案

应用程序OOM

简介

最常见的是发生堆内存异常“java.lang.OutOfMemoryError: Java heap space”

排查方案

查看堆内存异常时生成的dump文件。

dump文件

  1. 默认路径:当前路径下,文件名为java_pid[pid].hprof。
  2. 自定义的路径其可以使用-XX:HeapDumpPath选项来指定路径

然后使用MAT/jprofiler/VisualVM/jhat等工具进行分析即可。

被操作系统OOM-Killer

简介

        Linux 内核有个机制叫OOM killer(Out-Of-Memory killer),该机制会在如下情况下杀掉进程:

  1. 占内存过大,尤其是很快消耗大量内存的进程
  2. 内存不够用

排查方案

方案1:查看日志文件:/var/log/message

直接:grep "Out of memory" /var/log/messages

结果示例:(如果出现下边这样,有“Out of memory: xxx”,说明发生了OOM-Killer)

java进程视频 java进程不见了怎么定位_开发语言

方案2:使用dmesg命令

dmesg -T | grep "Out of memory"      # -T 是显示时间戳

结果示例:(如果出现下边这样,有“Out of memory: xxx”,说明发生了OOM-Killer)

java进程视频 java进程不见了怎么定位_开发语言_02

JVM出错

简介

        当JVM发生致命错误导致崩溃时,会生成一个hs_err_pid_xxx.log这样的文件,该文件包含了导致 JVM crash 的重要信息,我们可以通过分析该文件定位到导致 JVM Crash 的原因,从而修复保证系统稳定。

排查方案

默认情况下,该文件是生成在工作目录下的,当然也可以通过 JVM 参数指定生成路径: 

-XX:ErrorFile=/var/log/hs_err_pid<pid>.log

这个文件的内容他主要有如下内容

  • 日志头文件
  • 导致 crash 的线程信息
  • 所有线程信息
  • 安全点和锁信息
  • 堆信息
  • 本地代码缓存
  • 编译事件
  • gc 相关记录
  • jvm 内存映射
  • jvm 启动参数
  • 服务器信息

        拿到这个文件后,不用说了,慢慢啃吧。这个文件巨复杂,如果要会读这个文件,请下点功夫。