1、背景 TLDR
垃圾回收器的暂停问题对实时响应要求较高的服务来说,一直是个痛点, CMS和G1等主流垃圾回收器的数十毫秒乃至上百毫秒的暂停时间相当致命。此外,调优门槛也相对较高,需要对垃圾回收器的内部机制有一定的了解,才能够进行有效的调优。
随着ZGC的出现, 使得这一痛点彻底解决, ZGC 最初在 JDK 11 中作为实验性功能引入,并在 JDK 15 中宣布为生产就绪, 由于 JDK17 才是比较正式提供给大众实用的LTS支持版本,而且一部分公司已经在使用,所以本文力推 JDK17。
ZGC 作为一款低延迟垃圾收集器,旨在满足以下目标:
- 8MB 到 16TB 的堆大小支持
- 10ms 最大 GC 暂时
- 最糟糕的情况下吞吐量会降低 15%(实测,如果参数配置的问题可能更糟, 官方这个稍微吹牛了点, 说实话就是用 CPU 换 GC 时间,也没有那么高大上)
1.1 升级 JDK17 的不可拒绝的理由
低延迟的业务需求,毫秒级耗时的 GC
据美团的开发说:
在 Zeus 服务不同集群中,ZGC 在低延迟(TP999 < 200ms)场景中收益较大:
- TP999:下降 12~142ms,下降幅度 18%~74%。
- TP99:下降 5~28ms,下降幅度 10%~47%。
可以忽略的升级 JDK17 的理由:
- 新版的 Spring Boot 官方最低支持 JDK17,想使用新Spring版本,就得升级;
- JIT 编译器的增强;
- JDK 17 中的新功能,例如 Sealed 类、Pattern Matching、Records 等;
- 升级到 JDK 17 可以获得更好的安全性,包括修复的漏洞和强化的安全机制。
1.2 适用场景
- 网关服务
- Web API
暂不推荐场景:定时任务、批量任务、高 CPU 密集型应用。
2、升级前后对比
话不多说,先看效果。
环境:
CPU:4c
Mem: 6GB
G1 参数:
-Xmx3500m -Xms3500m -XX:+UseG1GC -XX:MaxGCPauseMillis=100
-XX:G1ReservePercent=10 -XX:ConcGCThreads=2 -XX:ParallelGCThreads=5
-XX:G1HeapRegionSize=16m -XX:MaxTenuringThreshold=14
-XX:SurvivorRatio=8
ZGC 参数:
--add-opens=java.base/java.lang=ALL-UNNAMED -Xms3500m -Xmx3500m -XX:ReservedCodeCacheSize=256m -XX:InitialCodeCacheSize=256m -XX:+UnlockExperimentalVMOptions -XX:+UseZGC -XX:ConcGCThreads=1 -XX:ParallelGCThreads=3 -XX:ZCollectionInterval=60 -XX:ZAllocationSpikeTolerance=4 -XX:+UnlockDiagnosticVMOptions -XX:-ZProactive -Xlog:safepoint,classhisto*=trace,age*,gc*=info:file=/opt/gc-%t.log:time,tid,tags:filecount=5,filesize=50m
上述两个参数,均已经在生产环境实验过, 生产环境的机器是单机拥有 1500 业务 tps 的机器。
2.1 GC 耗时对比
从上图可见, GC 耗时是有着质的区别的,这个区别是你用 CMS、Parallel GC、 G1 等呕心沥血也调校不出来的。
这么短的GC, 可以保证,应用因为JVM层面的卡顿都保持在 1ms 以内, 这也是为啥说这点才是不能拒绝的理由。
2.2 CPU 使用对比
从 CPU 使用上看, JDK17 相同的代码, 比 JDK8 要高出 10 ~ 20%
3、升级方法
3.1 JDK 选择或安装
使用 JDK17 前必须要安装 JDK17, 对于不同的 Linux 发行版或者操作系统安装方法各不相同, 下面给出了一些样例, 仅供参考。
# ubuntu 安装jdk17
sudo apt install openjdk-17-jdk
# docker 基础镜像
docker pull openjdk:17-slim
docker pull openjdk:17-jdk-oraclelinux7
FROM openjdk:17-slim
3.2 JVM 参数调整
有了 JDK17 后,已经具备了让你的 Java 程序运行在 JDK17 上的基本条件了,下一步便是配置 JVM 参数如下(有需要的话,可以自行把换行整理下):
--add-opens=java.base/java.lang=ALL-UNNAMED \
-Xms1500m -Xmx1500m \
-XX:ReservedCodeCacheSize=256m \
-XX:InitialCodeCacheSize=256m \
-XX:+UnlockExperimentalVMOptions \
-XX:+UseZGC \
-XX:Cnotallow=1 -XX:ParallelGCThreads=2 \
-XX:ZCollectinotallow=30 -XX:ZAllocatinotallow=5 \
-XX:+UnlockDiagnosticVMOptions -XX:-ZProactive \
-Xlog:safepoint,classhisto*=trace,age*,gc*=info:file=/opt/gc-%t.log:time,tid,tags:filecount=5,filesize=50m \
-XX:+HeapDumpOnOutOfMemoryError \
-XX:HeapDumpPath=/opt/errorDump.hprof
参数释义
参考资料
https://tech.meituan.com/2020/08/06/new-zgc-practice-in-meituan.html