1. 概述

  • 一个 JVM 实例只存在一个堆内存,堆也是 Java 内存管理的核心区域

  • Java 堆区在 JVM 启动时被创建,空间大小也就确定了。是 JVM 管理的最大一块内存空间,堆空间大小是可调节的

  • 虚拟机规范规定,堆可以处于物理上不连续的内存空间中,但在逻辑上它应该被视为连续的

  • 所有的线程共享 Java 堆,在这里还可以划分线程私有的缓冲区(Thread Local Allocation Buffer,TLAB)

  • 虚拟机规范堆 Java 堆的描述是:所有的对象实例以及数组都应当在运行时分配在堆上。

  • 数组和对象可能用于不会存储在栈上,因为栈帧中保存引用,这个引用指向对象或者数组在堆中的位置

  • 在方法结束后,堆中的对象不会马上被移除,仅仅在垃圾收集的时候才会被移除

  • 堆,是 GC 执行垃圾回收的重点区域

内存细分

Java 7及以前堆内存逻辑上分为:新生区+养老区+永久区

Java 8及之后堆内存逻辑上分为:新生区+养老区+元空间

JVM(五)- 堆_计算机

2. 设置堆大小与 OOM

  • Java 堆区用于存储 Java 对象实例,那么堆的大小在 JVM 启动时就已经设定好了,可以通过选项 -Xmx-Xms 来设置。-X是 JVM 运行参数

    -Xms 用于表示堆区的起始内存,等价于 -XX:InitialHeapSize,ms 是memory start

    -Xmx 用于表示堆区最大内存,等价于 -XX:MaxHeapSize,mx 是是memory max

  • 一旦堆区的内存大小超过 -Xmx 所指定的最大内存时,将会抛出 OutOfMemoryError 异常

  • 通常将 -Xms 和 -Xmx 两个参数配置相同的值,其目的是为了能够在垃圾回收机制清理完堆区后不需要重新分隔计算堆区的大小,从而提高性能。

  • 默认情况下,初始内存大小:物理内存的 1/64,最大内存大小,物理内存的 1/4

3. 年轻代与老年代

存储在 JVM 中的 Java 对象可以被划分为两类:

  • 一类是是生命周期较短的瞬时对象,这类对象的创建和消亡都非常迅速
  • 另一类的生命周期非常长,某些极端情况下能够与 JVM 的生命周期保持一致

Java 堆区进一步细分的话,可以划分为年轻代(YoungGen)和老年代(OldGen)

其中年轻代又可划分为 Eden 空间,Survivor0 和 Survivor1空间(有时称为 from 区,to 区)

JVM(五)- 堆_老年代_02

在 HotSpot 中,Eden 空间和另外两个 Survivor 空间缺省所占比例为 8:1:1,可以通过选项 -XX:SurvivorRatio 调整这个空间比例

几乎所有的 Java 对象都是在 Eden 区被 new 出来的

绝大部分的 Java 对象的销毁都在新生代进行

可以使用选项 -Xmn 设置新生代最大内存大小

4. 图解对象分配过程

对象分配过程概述

为新对象分配内存是一件非常严谨和复杂的任务,JVM 的设计者们不仅需要考虑内存如何分配、在哪里分配等问题,并且由于内存分配算法与内存回收算法密切相关,所以还需要考虑 GC 执行完内存回收后是否会在内存空间产生内存碎片。

  1. new 的对象先放在 Eden 区,此区有大小限制。

  2. 当 Eden 区的空间填满时,程序又需要创建对象,JVM 的垃圾回收器将对 Eden 区进行垃圾回收(Minor GC),将 Eden 区中的不再被其他对象引用的对象进行销毁。再加载成新的对象放到 Eden 区。

  3. 然后将 Eden 中的剩余对象移动到幸存者 0 区

  4. 如果再次触发垃圾回收,此时上次幸存下来的放到幸存者 0 区的,如果没有回收,就会放到幸存者 1 区。

  5. 如果再次经历垃圾回收,此时会重新放回幸存者 0 区,接着再去幸存者 1 区。

  6. 什么时候能去养老区?可以设置次数,默认是 15 次

    -XX:MaxTenuringThreshold=

  7. 在养老区,相对悠闲。当养老区内存不足时,再次出发 GC:Major GC,进行养老区的内存清理。

  8. 若养老区执行了 Major GC 后发现依然无法进行对象的保存,就会产生 OOM 异常。

总结

  1. 针对幸存者 s0, s1 区的总结

    复制之后有交换,谁空谁是 to

  2. 关于垃圾回收

    频繁在新生区收集,很少在养老区收集,几乎不在永久区/元空间收集。

特殊情况

JVM(五)- 堆_计算机_03

调优工具

  • JDK 命令行
  • Eclipse:Memory Analyzer Tool
  • Jconsole
  • VisualVM
  • Jprofiler
  • Java Flight Recoder
  • GCViewer
  • GC Easy

5. Minor GC、Major GC、Full GC

区别

JVM 在进行 GC 时,并非每次对三个内存区域(新生代,老年代,方法区/元空间)一起回收的,大部分时候回收的是新生代。

针对 HotSpot JVM 的实现,它里面的 GC 按照回收区域又分为两大类型

  • 一种是部分收集(Partial GC)
  • 另一是整堆收集(Full GC)
部分收集:不是完整的收集整个 Java 堆的垃圾收集,其中又分为:
  • 新生代收集(Minor GC / Young GC):只是新生代垃圾收集

  • 老年代收集(Major GC / Old GC):只是老年代的垃圾收集

    目前,只有 CMS GC 会有单独收集老年代的行为

    注意:很多时候 Major GC 会和 Full GC 混用,需要具体分辨老年代回收还是整堆回收。

  • 混合收集(Mixed GC):收集整个新生代以及部分老年代的垃圾收集

    目前,只有 G1 GC 会有这种行为

整堆收集:收集整个 Java 堆和方法区的垃圾收集

年轻代(Minor GC)触发机制

  • 当年轻代空间不足时,就会触发 Minor GC,这里的年轻代指的是 Eden 代满,Survivor 满不会引发 GC。每次 Minor GC 会清理年轻代的内存。
  • 因为 Java 对象大多数是朝生夕死的,所以 Minor GC 非常频繁,一般回收速度也很快。
  • Minor GC 会引发 STW,暂停其他用户线程,等垃圾回收结束,用户线程才恢复运行。

老年代(Major GC / Full GC)触发机制

  • 是发生在老年代的 GC,对象从老年代消失时,Major GC / Full GC 就发生了

  • 出现了 Major GC,经常会伴随至少一次的 Minor GC(但非绝对,在 Parallel Scavenge 收集器收集策略里就有直接进行 Major GC 的策略选择过程

    也就是在老年代空间不足时,会先尝试触发 Minor GC,如果之后空间还不足,那么触发 Major GC

  • Major GC 速度一般比 Minor GC 慢 10 倍以上,STW 时间更长

  • 如果 Major GC 后,内存还不足,就报 OOM

  • Major GC 的速度一般会比 Minor GC 慢 10 倍以上

Full GC 触发机制

触发 Full GC 的情况有 5 种

  1. 调用 System.gc() 时,系统建议执行 Full GC,但是不必然执行
  2. 老年代空间不足
  3. 方法区空间不足
  4. 通过 Minor GC 后进入老年代的平均大小大于老年代的可用内存
  5. 由 Eden 区,survivor space0(From Space)区向 survivor space1(To Space)区赋值时,对象大小大于 To Sapce 可用内存,则把该对象转存到老年代,且老年代的可用内存小于该对象大小

Full GC 在开发或调优中要避免,暂停时间会短一些。

6. 堆空间分代思想

为什么把 Java 堆分代?

经研究,不同对象生命周期不同,大多数为临时对象

  • 新生代:有 Eden,两块大小相等的 Survivor 构成,to 总为空
  • 老年代:存放新生代中经历多次 GC 仍然存活的对象

不分代也可以工作,分代的目的是为了提高性能。如果没有分代,垃圾回收就要在所有区域扫描。

7. 内存分配策略

针对不同年龄段的对象分配原则如下所示

  • 优先分配到 Eden

  • 大对象直接分配到老年代

    尽量避免出现过多大对象

  • 长期存活的对象分配到老年代

  • 动态对象年龄判断

    如果 Survivor 区中相同年龄的所有对象大小的总和大于 Survivor 空间的一半,年龄大于或等于该年龄的对象可以直接进入老年代,无需等到 MaxTenuringThreshold 中要求的年龄。

  • 空间分配担保

    -XX:HandlePromotionFailure

8. 为对象分配内存:TLAB

为什么有 TLAB(Thread Local Allocation Buffer)?

  • 堆区是线程共享区域,任何线程都可以访问到堆区中的共享数据
  • 由于对象实例的创建在 JVM 中非常频繁,因此在并发环境下从堆区中划分内存空间是线程不安全的
  • 为避免多个线程操作同一地址,需要加锁等机制,进而影响分配速度

什么是 TLAB?

从内存模型而不是垃圾回收的角度,对 Eden 区继续划分, JVM 为每个线程分配了一个私有缓存区域,它包含在 Eden 空间内。

多线程同时分配内存时,使用 TLAB 可以避免一系列的非线程安全问题,同时还能够提升内存分配的吞吐量,因此我们可以将这种内存分配方式称为 快速分配策略。

9. 堆空间参数设置

-XX:+PrintFlagInitial,查看所有参数的默认初始值

-XX:+PrintFlagFinal,查看所有参数的最终值

-Xms,初始堆空间内存(默认是物理内存1/64)

-Xmx,最大堆空间内存(默认物理内存的1/4)

-Xmn,设置新生代答案小(初始值和最大值)

-XX:NewRatio,配置新生代和老年代在堆结构的占比

-XX:SurvivorRatio,配置新生代中 Eden 和 s0/s1 空间比例

-XX:MaxTenuringThreshold,设置新生代垃圾的最大年龄

-XX:+PrintGCDetails,输出详细 GC 处理日志

-XX:HandlePromotionFailure,是否设置空间分配担保

10. 堆是分配对象的唯一选择吗

不是,可以在栈上分配

没有修不好的电脑