深入理解java虚拟机(1)|java内存区域详解
目录
- 深入理解java虚拟机(1)|java内存区域详解
- 1、总览
- 1.1、程序计数器
- 1.2、Java 虚拟机栈
- 1.3、本地方法栈
- 1.4、Java 堆
- 1.5、方法区
- 直接内存
- 2、HotSpot 虚拟机堆中的对象
- 2.1、对象的创建(遇到一条 new 指令时)
- 2.2、对象的内存布局
- 2.3、对象的访问
- 2.3.1、句柄访问
- 直接指针访问
- 3、面试知识
1、总览
虚拟机分为五个区域:程序计数器、虚拟机栈、本地方法栈、堆、方法区,直接内存不属于 JVM 运行时数据区的一部分),除了程序计数器其他的地方都有可能出现 OOM (OutOfMemoryError)
1.1、程序计数器
- 当前线程所执行的字节码的行号指示器,线程独有,字节码解释器通过改变这个计数器的值来确定下一条要执行的字节码指令的位置
- 执行 Java 方法和 native 方法时的区别:
- Java 方法时:记录虚拟机正在执行的字节码指令地址;
- 执行 native 方法时:无定义;
- 是 5 个区域中唯一不会出现 OOM 的区域。
1.2、Java 虚拟机栈
- Java 方法执行的内存模型,每个方法执行的过程,就是它所对应的栈帧在虚拟机栈中入栈到出栈的过程;
- 服务于 Java 方法;
- 可能抛出的异常:
- OutOfMemoryError(在虚拟机栈可以动态扩展的情况下,扩展时无法申请到足够的内存);
- StackOverflowError(线程请求的栈深度 > 虚拟机所允许的深度);
- 虚拟机参数设置:
-Xss
.
1.3、本地方法栈
- 服务于 native 方法;
- 可能抛出的异常:与 Java 虚拟机栈一样。
1.4、Java 堆
- 唯一的目的:存放对象实例;
- 垃圾收集器管理的主要区域;
- 可以处于物理上不连续的内存空间中;
- 可能抛出的异常:
- OutOfMemoryError(堆中没有内存可以分配给新创建的实例,并且堆也无法再继续扩展了)。
- 虚拟机参数设置:
- 最大值:
-Xmx
- 最小值:
-Xms
- 两个参数设置成相同的值可避免堆自动扩展。
1.5、方法区
- 存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据;
- 类信息:即 Class 类,如类名、访问修饰符、常量池、字段描述、方法描述等。
- 垃圾收集行为在此区域很少发生;
- 不过也不能不清理,对于经常动态生成大量 Class 的应用,如 Spring 等,需要特别注意类的回收状况。
- 运行时常量池也是方法区的一部分;
- Class 文件中除了有类的版本、字段、方法、接口等描述信息外,还有一项是常量池,用于存放编译器生成的各种字面量(就是代码中定义的 static final 常量)和符号引用,这部分信息就存储在运行时常量池中。
- 可能抛出的异常:
- OutOfMemoryError(方法区无法满足内存分配需求时)。
直接内存
- JDK 1.4 的 NIO 类可以使用 native 函数库直接分配堆外内存,这是一种基于通道与缓冲区的 I/O 方式,它在 Java 堆中存储一个 DirectByteBuffer 对象作为堆外内存的引用,这样就可以对堆外内存进行操作了。因为可以避免 Java 堆和 Native 堆之间来回复制数据,在一些场景可以带来显著的性能提高。
- 虚拟机参数设置:
-XX:MaxDirectMemorySize
- 默认等于 Java 堆最大值,即
-Xmx
指定的值。
- 将直接内存放在这里讲解的原因是它也可能会出现 OutOfMemoryError;
- 服务器管理员在配置 JVM 参数时,会根据机器的实际内存设置
-Xmx
等信息,但经常会忽略直接内存(默认等于-Xmx
设置值),这可能会使得各个内存区域的总和大于物理内存限制,从而导致动态扩展时出现 OOM。
2、HotSpot 虚拟机堆中的对象
这一小节将对 JVM 对 Java 堆中的对象的创建、布局和访问的全过程进行讲解。
2.1、对象的创建(遇到一条 new 指令时)
- 检查这个指令是否能在常量池中定位到一个类的符号引用,并检查这个符号引用所代表的类是否已经加载、链接、初始化过,如果没有,将这个类先加在进内存;
- 类加载检查通过后,虚拟机将为新对象分配内存,此时已经可以确定存储这个对象所需的内存大小;
- 在堆中为新对象分配可用内存;
- 初始化分配到的内存;
- 设置对象头数据
此时已经创建好了,但对于java程序的角度看,才刚刚开始,构造函数都还没执行
第 3 步,在堆中为新对象分配可用内存时,会涉及到以下两个问题:
那么,你作为一个海王,如何在堆中为新对象划分可用的内存?
- 指针碰撞(内存分配规整)-- 开辟一层楼
- 用过的内存放一边,没用过的内存放一边,中间用一个指针分隔;
- 分配内存的过程就是将指针向没用过的内存那边移动所需的长度;
- 空闲列表(内存分配不规整)-- 进别墅后,要电子记录
- 维护一个列表,记录哪些内存块是可用的;
- 分配内存时,从列表上选取一块足够大的空间分给对象,并更新列表上的记录;
如何处理多线程创建对象时,划分内存的指针的同步问题?
- 对分配内存空间的动作进行同步处理(CAS);
- 把内存分配动作按照线程划分在不同的空间之中进行;
- 每个线程在 Java 堆中预先分配一小块内存,称为本地线程分配缓冲(Thread Local Allocation Buffer,TLAB),下面有讲解;
- 哪个线程要分配内存就在哪个线程的 TLAB 上分配,TLAB 用完需要分配新的 TLAB 时,才需要同步锁定;
- 通过
-XX:+/-UseTLAB
参数设定是否使用 TLAB。
2.2、对象的内存布局
- 对象头:
- 第一部分:存储对象自身运行时的数据,HashCode、GC分代年龄等(Mark Word);
- 第二部分:类型指针,指向它的类元数据的指针,虚拟机通过这个指针来判断这个对象是哪个类的实例(HotSpot 采用的是直接指针的方式访问对象的);
- 如果是个数组对象,对象头中还有一块用于记录数组长度的数据。
- 实例数据:
- 默认分配顺序:longs/doubles、ints、shorts/chars、bytes/booleans、oops (Ordinary Object Pointers),相同宽度的字段会被分配在一起,除了 oops,其他的长度由长到短;
- 默认分配顺序下,父类字段会被分配在子类字段前面。
注:HotSpot VM要求对象的起始地址必须是8字节的整数倍,所以不够要补齐。
2.3、对象的访问
Java 程序需要通过虚拟机栈上的 reference 数据来操作堆上的具体对象,reference 数据是一个指向对象的引用,不过如何通过这个引用定位到具体的对象,目前主要有以下两种访问方式:句柄访问和直接指针访问。
2.3.1、句柄访问
句柄访问会在 Java 堆中划分一块内存作为句柄池,每一个句柄存放着到对象实例数据和对象类型数据的指针。
优势:对象移动的时候(这在垃圾回收时十分常见)只需改变句柄池中对象实例数据的指针,不需要修改reference本身。
直接指针访问
直接指针访问方式在 Java 堆对象的实例数据中存放了一个指向对象类型数据的指针,在 HotSpot 中,这个指针会被存放在对象头中。
优势:减少了一次指针定位对象实例数据的开销,速度更快。
3、面试知识
如何处理多线程创建对象时,划分内存的指针的同步问题?
- 对分配内存空间的动作进行同步处理(CAS);
- 把内存分配动作按照线程划分在不同的空间之中进行;
- 每个线程在 Java 堆中预先分配一小块内存,称为本地线程分配缓冲(Thread Local Allocation Buffer,TLAB);
- 哪个线程要分配内存就在哪个线程的 TLAB 上分配,TLAB 用完需要分配新的 TLAB 时,才需要同步锁定;
- 通过
-XX:+/-UseTLAB
参数设定是否使用 TLAB。
对象头包含什么?
- 对象自身运行时数据
- GC分代年龄
- HAshCode值
- 指针(指向类元信息指针)
对内存中存放的一定都是对象吗?
不一定,如果虚拟机中访问对象的方式是句柄方式,则也会在堆中划分一块句柄池用于保存对象的实例数据内存地址和类型内存地址,优势:对象移动的时候(这在垃圾回收时十分常见)只需改变句柄池中对象实例数据的指针,不需要修改reference本身。不过在 HotSpot 中,直接指针访问,优势:减少了一次指针定位对象实例数据的开销,速度更快。
什么是TLAB?
简要解释:
- 是一块线程私有的缓冲区,这个缓冲区在对内存的eden区,目的是消除线程间对象内存分配竞争,同时提升了性能
- 缓冲区本质是三个指针管理的区域:start,top 和 end
- start和end卡住eden区一块空间,不让线程进来,top是分配指针,随着内存分配从start指针往后面移
- Java中Thread的run方法,第一步就是先初始化TLAB
- 当线程分配内存时,会先判断这块缓冲区是否够用,不够就判断可用空间是否大于浪费阈值,大于就直接在共享区域分配,小于就直接重新开辟一个缓冲区
概念
线程本地缓冲区(Thread Local Allocation Buffer)
TLAB是线程的一块私有内存,它是虚拟机在堆内存的eden划分出来的,如果设置了虚拟机参数 -XX:UseTLAB,在线程初始化时,同时也会申请一块指定大小的内存, 只给当前线程使用, 这样每个线程都单独拥有一个Buffer,如果需要分配内存,就在自己的Buffer上分配,这样就不存在竞争的情况,可以大大提升分配效率,当Buffer容量不够的时候,再重新从Eden区域申请一块继续使用。
TLAB只是让每个线程有私有的分配指针,但底下存对象的内存空间还是给所有线程访问的,只是其它线程无法在这个区域分配而已,当一个TLAB用满 ,就会新申请一个TLAB。
TLAB实现
class ThreadLocalAllocBuffer: public CHeapObj<mtThread> {
friend class VMStructs;
private:
HeapWord* _start; // TLAB地址
HeapWord* _top; // 最后分配后的地址(分配指针)
HeapWord* _pf_top; // 分配预取水印
HeapWord* _end; // 分配结束(地址)
size_t _desired_size; // TLAB内存大小
size_t _refill_waste_limit; // 最大浪费空间
TLAB的本质其实是三个指针管理的区域:start,top 和 end,每个线程都会从Eden分配一块空间,例如说100KB,作为自己的TLAB,其中 start 和 end 是占位用的,标识出 eden 里被这个 TLAB 所管理的区域,卡住eden里的一块空间不让其它线程来这里分配。 top为分配指针,最开始指向start位置,随着内存分配往后移。
Java中Thread的run方法,第一步就是先初始化TLAB,虚拟机如果设置了 UseTLAB 参数就可以生成一个ThreadLocalAllocBuffer对象初始化TLAB
当线程在TLAB中分配内存时,会先判断当前TLAB的剩余容量是否大于需要分配的大小,如果剩余容量不够,然后先会判断剩余容量是否大于浪费阈值,如果大于,就直接在共享的Eden区进行分配,当前TLAB保留;如果小于,就会重新再申请一块TLAB,当前TLAB被舍弃。
在申请TLAB时如果失败,说明eden没有足够的空间,此时就会触发Minor GC。当Minor GC回收算法触发后释放的空间还不够的时候,对象会被直接在老年代创建。