GC的基础知识

1.什么是垃圾

C语言申请内存:malloc free

C++: new delete

c/C++ 手动回收内存

Java: new ?

自动内存回收,编程上简单,系统不容易出错,手动释放内存,容易出两种类型的问题:

  1. 忘记回收
  2. 多次回收

没有任何引用指向的一个对象或者多个对象(循环引用)

2.如何定位垃圾

  1. 引用计数(ReferenceCount)
  2. 根可达算法(RootSearching)

3.常见的垃圾回收算法

  1. 标记清除(mark sweep) - 位置不连续 产生碎片 效率偏低(两遍扫描)
  2. 拷贝算法 (copying) - 没有碎片,浪费空间
  3. 标记压缩(mark compact) - 没有碎片,效率偏低(两遍扫描,指针需要调整)

4.JVM内存分代模型(用于分代垃圾回收算法)

  1. 部分垃圾回收器使用的模型

除Epsilon ZGC Shenandoah之外的GC都是使用逻辑分代模型

G1是逻辑分代,物理不分代

除此之外不仅逻辑分代,而且物理分代

  1. 新生代 + 老年代 + 永久代(1.7)Perm Generation/ 元数据区(1.8) Metaspace
  1. 永久代 元数据 - Class
  2. 永久代必须指定大小限制 ,元数据可以设置,也可以不设置,无上限(受限于物理内存)
  3. 字符串常量 1.7 - 永久代,1.8 - 堆
  4. MethodArea逻辑概念 - 永久代、元数据
  1. 新生代 = Eden + 2个suvivor区
  1. YGC回收之后,大多数的对象会被回收,活着的进入s0
  2. 再次YGC,活着的对象eden + s0 -> s1
  3. 再次YGC,eden + s1 -> s0
  4. 年龄足够 -> 老年代 (15 CMS 6)
  5. s区装不下 -> 老年代
  1. 老年代
  1. 顽固分子
  2. 老年代满了FGC Full GC
  1. GC Tuning (Generation) 【GC调优(分代模型)】
  1. 尽量减少FGC
  2. MinorGC = YGC
  3. MajorGC = FGC
  1. 对象分配过程:
  1. 小对象在栈中分配
  2. 大对象在新生代分配, 先过TLAB(eden区专属线程的空间),不够到eden(Minor GC中去到survior)
  3. 更大的对象eden装不下的->old区
  4. FULL GC,清除没了
  1. 动态年龄: https://www.jianshu.com/p/989d3b06a49d
  2. 分配担保: YGC期间 survivor区空间不够了 空间担保直接进入老年代 参考:https://cloud.tencent.com/developer/article/1082730

5.常见的垃圾回收器

  1. Serial 年轻代 串行回收
  2. PS 年轻代 并行回收
  3. ParNew 年轻代 配合CMS的并行回收
  4. SerialOld
  5. ParallelOld
  6. ConcurrentMarkSweep 老年代 并发的, 垃圾回收和应用程序同时运行,降低STW的时间(200ms) CMS问题比较多,所以现在没有一个版本默认是CMS,只能手工指定 CMS既然是MarkSweep,就一定会有碎片化的问题,碎片到达一定程度,CMS的老年代分配对象分配不下的时候,使用SerialOld 进行老年代回收 想象一下: PS + PO -> 加内存 换垃圾回收器 -> PN + CMS + SerialOld(几个小时 - 几天的STW) 几十个G的内存,单线程回收 -> G1 + FGC 几十个G -> 上T内存的服务器 ZGC 算法:三色标记 + Incremental Update
  7. G1(10ms) 算法:三色标记 + SATB
  8. ZGC (1ms) PK C++ 算法:ColoredPointers + LoadBarrier
  9. Shenandoah 算法:ColoredPointers + WriteBarrier
  10. Eplison
  11. PS 和 PN区别
  12. 垃圾收集器跟内存大小的关系
  1. Serial 几十兆
  2. PS 上百兆 - 几个G
  3. CMS - 20G
  4. G1 - 上百G
  5. ZGC - 4T - 16T(JDK13)

1.8默认的垃圾回收:PS + ParallelOld

1.9默认垃圾回收器:G1(1.8中可以使用,且相对比较完善了)