1、背景
java进程执行特定作业出现内存溢出,跑很多类似作业是正常的。
2、常见问题及原因分析
当然这个问题不难,主要是借助这个机会来一起整理下之前出现过的问题,希望能举一反三。
2.1 问题场景一
Exception in thread thread_name: java.lang.OutOfMemoryError: Java heap space
一般会有三种情况导致:
堆内存太小,无法满足应用的需 要。
内存泄漏,泄漏的内存被hold住,无法使用。
Finalizer线程清理实现了finalize()方法的对象速度慢于生成这些对象的速度。
比如在main线程中,创建大量的实现了finalize()的类对象,由于main线程优先级大于Finalizer线程,所以main有更多的cpu执行时间,导致对象生成速度大于清除速度。
class Finalizable {
@Override
protected void finalize() throws Throwable {
try {
this.wait(0);
} catch(Exception e) {
System.err.println(e);
}
}
public static void main(String args[]) {
//仅仅为了说明问题
while(true) {
Finalizable f = new Finalizable();
}
}
}
2.2 问题场景二
Exception in thread thread_name: java.lang.OutOfMemoryError: GC Overhead limit exceeded
gc的内存太小,大部分时间都在gc(98%),且回收的堆内存不到2%,且持续fullgc到了第5次。存活对象无法装入heap中,一般需要加大heap。
2.3 问题场景三
Exception in thread thread_name: java.lang.OutOfMemoryError: Requested array size exceeds VM limit
数组对象太大, 无法载入堆内存中,原因可能是heap太小或者程序不经意产生了大数组对象,比较好排查。
2.4 问题场景四
Exception in thread thread_name: java.lang.OutOfMemoryError: Metaspace
分配给java类元数据的本地内存用尽通过增加MaxMetaSpaceSize,或者减少堆内存解决。
2.5 问题场景五
Exception in thread thread_name: java.lang.OutOfMemoryError: Compressed class space
简单理解就是说,在64位jvm出现之后,用于操作内存的OOPS(原始指针)变成了64位。为了避免OOPS扩大一倍带来的性能损耗,使用UseCompressedOops参数可以用32位的指针来指向一个内存空间。如果使用率参数UseCompressedClassPointers,那么也可以用32位的指针来指向操作的内存区域,这些指针指向的区域被叫做“Compressed class space”。如果引入太多包,可能会超过Compressed class space导致出现该问题,一般调大Compressed class space就好。
2.6 问题场景六
Exception in thread thread_name: java.lang.OutOfMemoryError: reason stack_trace_with_native_method
本地方法内存分配失败,一般通过OS工具来定位问题。
2.7 问题场景七
Exception in thread thread_name: java.lang.OutOfMemoryError: Metaspace
Metadata用于保存jvm的静态数据(如类和方法),分配给java类元数据的内存用完,比如你的应用加载很多类容易出现该问题。通过增加MaxMetaSpaceSize,或者减少堆内存解决。
总之,最后定位的问题是第一种类型,也就是heap不够,现在看下如何排查问题。
3. 问题定位
1、查看jvm的信息
jinfo -flags {pid}
发现堆内存的大小很小,只有128M。
2、导出进程的堆内存信息。
添加运行的JVM参数(短驻进程)
XX:+HeapDumpOnOutOfMemeoryError
XX:HeapDumpPath=/tmp/heap_error.gc
3、MAT分析堆内存
发现ArrayList中占用的内存超过70%,因此分析是存在批处理或者循环或者内存泄漏。进一步分析发现是批处理数据量太大(10000),并且每条数据量是文本数据,大对象太多直接导致堆塞满。
4、解决
设置合理的批处理量
设置更大的堆
参考