1、背景

java进程执行特定作业出现内存溢出,跑很多类似作业是正常的。

2、常见问题及原因分析

当然这个问题不难,主要是借助这个机会来一起整理下之前出现过的问题,希望能举一反三。

2.1 问题场景一

Exception in thread thread_name: java.lang.OutOfMemoryError: Java heap space

一般会有三种情况导致:

堆内存太小,无法满足应用的需 要。

内存泄漏,泄漏的内存被hold住,无法使用。

Finalizer线程清理实现了finalize()方法的对象速度慢于生成这些对象的速度。

比如在main线程中,创建大量的实现了finalize()的类对象,由于main线程优先级大于Finalizer线程,所以main有更多的cpu执行时间,导致对象生成速度大于清除速度。

class Finalizable {
@Override
protected void finalize() throws Throwable {
try {
this.wait(0);
} catch(Exception e) {
System.err.println(e);
}
}
public static void main(String args[]) {
//仅仅为了说明问题
while(true) {
Finalizable f = new Finalizable();
}
}
}

2.2 问题场景二

Exception in thread thread_name: java.lang.OutOfMemoryError: GC Overhead limit exceeded

gc的内存太小,大部分时间都在gc(98%),且回收的堆内存不到2%,且持续fullgc到了第5次。存活对象无法装入heap中,一般需要加大heap。

2.3 问题场景三

Exception in thread thread_name: java.lang.OutOfMemoryError: Requested array size exceeds VM limit

数组对象太大, 无法载入堆内存中,原因可能是heap太小或者程序不经意产生了大数组对象,比较好排查。

2.4 问题场景四

Exception in thread thread_name: java.lang.OutOfMemoryError: Metaspace

分配给java类元数据的本地内存用尽通过增加MaxMetaSpaceSize,或者减少堆内存解决。

2.5 问题场景五

Exception in thread thread_name: java.lang.OutOfMemoryError: Compressed class space

简单理解就是说,在64位jvm出现之后,用于操作内存的OOPS(原始指针)变成了64位。为了避免OOPS扩大一倍带来的性能损耗,使用UseCompressedOops参数可以用32位的指针来指向一个内存空间。如果使用率参数UseCompressedClassPointers,那么也可以用32位的指针来指向操作的内存区域,这些指针指向的区域被叫做“Compressed class space”。如果引入太多包,可能会超过Compressed class space导致出现该问题,一般调大Compressed class space就好。

2.6 问题场景六

Exception in thread thread_name: java.lang.OutOfMemoryError: reason stack_trace_with_native_method

本地方法内存分配失败,一般通过OS工具来定位问题。

2.7 问题场景七

Exception in thread thread_name: java.lang.OutOfMemoryError: Metaspace

Metadata用于保存jvm的静态数据(如类和方法),分配给java类元数据的内存用完,比如你的应用加载很多类容易出现该问题。通过增加MaxMetaSpaceSize,或者减少堆内存解决。

总之,最后定位的问题是第一种类型,也就是heap不够,现在看下如何排查问题。

3. 问题定位

1、查看jvm的信息

jinfo -flags {pid}

发现堆内存的大小很小,只有128M。

2、导出进程的堆内存信息。

添加运行的JVM参数(短驻进程)

XX:+HeapDumpOnOutOfMemeoryError
XX:HeapDumpPath=/tmp/heap_error.gc

3、MAT分析堆内存

发现ArrayList中占用的内存超过70%,因此分析是存在批处理或者循环或者内存泄漏。进一步分析发现是批处理数据量太大(10000),并且每条数据量是文本数据,大对象太多直接导致堆塞满。

4、解决

设置合理的批处理量

设置更大的堆

参考