一、前言

        本文主要介绍如何从代码层面去定位内存泄漏的原因。无论是jdk还是open jdk,都使用到了虚拟机,前者使用JVM,后者使用GraalVM,并且它们都有相应的垃圾回收机制。其中,JVM是使用引用计数法和可达性分析算法,来判断对象是否是不再使用的对象,本质都是判断一个对象是否还会被引用。那么对于这种情况下,由于代码的实现不同就会出现很多种内存泄漏问题(让JVM误以为此对象还在引用中,无法回收,造成内存泄漏)。

二、排查方法

      常见的排查或定位方法,主要有以下7种。

  1. 静态集合类

  1.        如HashMap、LinkedList等等。如果这些变量被声明为静态的,那么它们生命周期与程序一致。
  2. 各种连接,如数据库连接、网络连接和IO连接

  1.        在对数据库进行操作的过程中,首先需要建立与数据库的连接,当不再使用时,需要调用close等方法来释放与数据库的连接。只有连接被关闭后,GC才会回收对应的对象。否则,如果对Connection、Statement、ResultSet、HttpURLConnection、BufferedReader、InputStream等等实例或者通道,不显性地关闭,将会造成大量的对象无法被回收,从而引起内存泄漏。
  2. 变量不合理的作用域

  1.        一般而言,一个变量的定义的作用范围大于其使用范围,很有可能会造成内存泄漏。另一方面,如果没有及时地把对象设置为null,很有可能导致内存泄漏的发生。
public class UsingRandom {		
	private String msg;
	public void receiveMsg(){
		readFromNet();// 从网络中接受数据保存到msg中
		saveDB();// 把msg保存到数据库中
	}
}

      如上面这个伪代码,通过readFromNet方法把接受的消息保存在变量msg中,然后调用saveDB方法把msg的内容保存到数据库中,此时msg已经就没用了,由于msg的生命周期与对象的生命周期相同,此时msg还不能回收,因此造成了内存泄漏。
      实际上这个msg变量可以放在receiveMsg方法内部,当方法使用完,那么msg的生命周期也就结束,此时就可以回收了。还有一种方法,在使用完msg后,把msg设置为null,这样垃圾回收器也会回收msg的内存空间。

  1. 内部类持有外部类

  1.        如果一个外部类的实例对象的方法返回了一个内部类的实例对象,这个内部类对象被长期引用了,即使那个外部类实例对象不再被使用,但由于内部类持有外部类的实例对象,这个外部类对象将不会被垃圾回收,这也会造成内存泄露。
          在Java中内部类的定义与使用,一般为成员内部类与匿名内部类。它们的对象都会隐式持有外部类对象的引用,影响外部类对象的回收。通过编译可以来验证这个理论。                    首先有如下代码:
public class OutClass {
    int  out =2;
    public class InnerClass{
        int in=1;
    }
}

      经过编译后:

//内部类:InnerClass
public class OutClass$InnerClass {
    int in;
	// 构造方法需要传入OutClass这个对象
    public OutClass$InnerClass(OutClass var1) {
        this.this$0 = var1;
        this.in = 1;
    }
}
//外部类:OutClass
public class OutClass {
    int out = 2;
    public OutClass() {
    }
    public class InnerClass {
        int in = 1;
        public InnerClass() {
        }
    }
}

       可以观察到,在内部类的构造方法中,会对外部类的成员变量进行初始化。即是内部类持有外部类的引用,导致外部类对象将不会被垃圾回收,造成内存泄露。

  1. 哈希值改变

  1.       当一个对象被存储进HashSet集合中以后,就不能修改这个对象中的那些参与计算哈希值的字段了。
          因为,当修改后,所得的哈希值与最初存储进HashSet集合中时的哈希值就不同了。在这种情况下,即使用contains()方法,也将返回找不到对象的结果,但是HashSet却一直持有修改前的对象的实例,导致不能被GC,造成内存泄露。
  2. 缓存

  1.        内存泄漏的另一个常见来源是缓存。举个例子,我们有时候为了减少与db的交互次数,会将查询出的对象实例放入缓存中,但是常常会忘记对这个缓存进行管理。比如忘记限制缓存大小。
          对于这个问题,可以使用WeakHashMap代表缓存,此种Map的特点是,当除了自身有对key的引用外,此key没有其他引用那么此map会自动丢弃此值。
  2. 事件处理

  1.       如监听器和回调机制等等,这里我们举前端的一个例子,使用定时器时,我们销毁了这个DOM,但是在定时器中使用了这个DOM,定时器中就保留了对这个DOM的引用,导致内存泄漏。所以需要在清除DOM时也要手动清除定时器。