2.3 HotSpot虚拟机对象

HotSpot虚拟机在Java堆中对象分配、布局和访问得全过程。

2.3.1 对象的创建

流程为:类加载检查->为对象分配内存->初始化零值->设置对象头->执行Class中方法

String str = new String("str");
-> 字节码
LINENUMBER 13 L0
    NEW java/lang/String
    DUP
    LDC "str"
    INVOKESPECIAL java/lang/String.<init> (Ljava/lang/String;)V
    ASTORE 1
  1. 类加载检查
    Java虚拟机处理new指令时,首先检查该指令的参数能否能在常量池中定位到类的符号引用,并且检查该引用代表的类是否已被加载、解析和初始化过。如果没有,则先执行相应的类加载过程。
  2. 分配内存
    在类加载检查通过后,接下来虚拟机将为新生对象分配内存。对象所需对象内存大小在类加载检查完成后便可确定(从Java堆中划分一块确定大小得内存快)。分配内存的方式有“指针碰撞”和“空闲列表”两种。

分配内存方式详解:
指针碰撞:如果Java堆中内存是绝对规整的,所有被使用过的内存都被放在一边,空闲的内存放在另一边,中间放着一个指针作为分界点的指示器,通过把指针像空闲空间方向挪动一段与对象大小相等的距离来分配内存。当使用Serial、ParNew等带压缩整理过程的器时,系统采用的分配算法时指针碰撞。
空闲列表:如果Java堆中的内存并不是规整的,已被使用的内存和空闲的内存交错在一起,没法使用“指针碰撞”分配内存。此时虚拟机必须维护一个空闲内存的列表,来记录堆中那些内存是可用的,在分配内存的时候在列表中找到一块足够大的空间划分给对象实例,并更新空闲列表上的记录。当时用CMS这种基于清除算法的收集器时,理论上(强调“理论上”是因为CMS的实现里面,设计了一个叫作Linear Allocation Buffer的分配缓冲区,通过空闲列表拿到一大块分配缓冲区之后,在它里面仍然可以使用指针碰撞来分配内存)只能采用“空闲列表”的方式来分配内存。

分配内存保证线程安全的方案
一种是分配内存空间的动作进行同步处理——实际上是虚拟机采用CAS配上失败重试的方式保证更新操作的原子性;
另一种是采用本地线程分配缓冲(TLAB),每个线程在Java堆中预先分配一小块内存来给新生对象分配使用,当本地缓冲区用完了,分配新的缓存区时需要同步锁定。可以通过-XX:+/-UseTLAB参数设定虚拟机是/否使用TLAB。

  1. 初始化零值
    虚拟机将分配到的内存空间都初始化零值,保证对象实例字段在Java代码中可以不赋初始值直接使用,使程序能访问到这些字段的数据类型所对应的零值。如果使用TLAB,此工作会提前至TLAB分配时顺便进行。
  2. 对象头设置
    对对象进行必要的设置——类的元数据信息、对象的哈希码、对象的GC分代年龄等信息,放置在对象头中。
  3. 执行Class文件中()方法构造
    new指令之后,从虚拟机的视角看一个新的对象已经产生,new指令之后会接着执行()方法,对对象进行初始化,一个真正可用的对象才算完全被构造出来。

2.3.2 对象的内存布局

在HotSpot虚拟机里,对象在堆内存中的存储布局可以划分为三个部分:对象头、实例数据和对齐填充。

  1. 对象头包括两类信息:Mark Word对象头数据和Klass Pointer类型指针。
  • Mark Word用于存储对象自身的运行时数据,如哈希码(HashCode)、GC分代年龄、锁状态标志、线程持有的锁、偏向线程ID、偏向时间戳等。根据虚拟机的位数确定数据长度;根据对象的状态复用存储空间,动态定义数据结构,提高空间利用效率来存储更多的数据。

存储内容

标志位

状态

对象哈希码、对象分代年龄

01

未锁定

指向锁记录的指针

00

轻量级锁定

指向重量级锁的指针

10

膨胀(重量级锁定)

空,不需要记录信息

11

GC标记

偏向线程ID、偏向时间戳、对象分代年龄

01

可偏向

32位虚拟机中未锁定(对象状态标志位为01)对象的空间分配

java虚拟机xss xms设置 深入解析java虚拟机hotspot_java虚拟机xss xms设置


Mark Word的数据结构


java虚拟机xss xms设置 深入解析java虚拟机hotspot_句柄_02

  • Klass Pointer用于存储对象指向它类型元数据的指针,Java虚拟机通过这个指针确定对象的实例类型。如果对象是数组类型,则需要三个机器码,因为JVM虚拟机可以通过Java对象的元数据信息确定Java对象的大小,但是无法从数组的元数据来确认数组的大小,所以用一块来记录数组长度。
  1. 实例数据部分是对象真正存储的有效信息。
  2. 对齐填充并不是必然存在的,也没有特别的含义,它仅仅起着占位符的作用。由于HotSpot VM的自动内存管理系统要求对象起始地址必须是8字节的整数倍,换句话说就是对象的大小必须是8字节的整数倍。对象头正好是8字节的倍数(1倍或者2倍),因此当对象实例数据部分没有对齐的话,就需要通过对齐填充来补全。

2.3.3 对象的访问定位

主流的访问方式主要有使用句柄和直接指针两种。

  • 句柄访问:Java堆中将可能会划分出一块内存来作为句柄池,reference中存储的就死对象的句柄地址,而句柄中包含了对象实例数据与类型数据各自具体的地址信息,结构如下图所示。
  • 直接指针:Java堆中对象的内存布局就必须考虑如何放置访问类型数据的相关信息,reference中存储的直接就是对象地址,如果只是访问对象本身的话,就不需要多一次间接访问的开销,结构如下图所示。

这两种对象访问的方式各有优势,使用句柄最大好处就是reference中存储的是稳定句柄地址,在对象被移动时只会改变句柄中的实例数据指针,而reference本身不需要被修改;
使用直接指针来访问的最大好处就是速度更快,它节省了一次指针定位的时间开销。HotSpot主要适用直接指针来进行对象访问。