java是一门面向对象的编程语言,java程序运行时无时无刻都有对象被创建。在语言层面上,创建对象仅仅是一个new关键字而已,而在虚拟机中对象的创建过程又是怎样呢?
注意:这里讨论的对象仅限于普通的java对象,不包括数组和Class对象

创建对象分以下几步:

1.验证对象类是否已经加载
  当java虚拟机遇到一条字节码new指令时,首先检查这个指令的参数是否能在常量池中定位一个类的符号引用,并且检查这个符号引用代表的类是否已被加载、解析和初始化过。如果没有先加载该类。


2.分配堆内存
  类加载完成后,虚拟机将为新生对象分配内存,所需内存的大小在类加载完成后便确定了。说白就是从堆内存中划出来一块大小确定的内存空间存储该对象。


3.对象初始化
  3.1对象体的初始化
  内存分配完成后,虚拟机将分配到的内存空间(但不包括对象头)都初始化为零。这步操作保证了对象的实例字段(这里包含从父类继承的字段)在java代码中可以不赋初始值就直接使用,是程序能访问到这些字段的数据类型所对应的零值。总结说就是给对象的各个实例字段及继承的实例字段初始赋值个零值。
  3.2对象头设置(Mark Word)
  哪个类的实例、如何才能找到类的元数据信息、对象的哈希码(实际上对象的哈希码会延后到真正调用Object.hashCode()方法时才计算)、GC分代年龄、锁状态等信息的设置


4.执行<init>()方法
  在上面工作都完成之后,从虚拟机的视角来看,一个新的对象已经产生。但是从java程序视角来看,对象的创建才刚刚开始——构造函数,即Class文件中的<init>()方法执行。执行之前所有的字段默认零值,对象需要的其他资源和状态信息也还没按照预定的意图构造好,<init>()方法的执行才真正是按照程序的设计初始化对象,给对象字段赋值等。



5.实例演示
写一个创建对象的demo:

public class NewDemo {

    public NewDemo getInstance(){
        return new NewDemo();
    }

}

getInstance()经过反编译后:我们分析一下创建对象的指令含义

public com.yx.demo.NewDemo getInstance();
    descriptor: ()Lcom/yx/demo/NewDemo;
    flags: ACC_PUBLIC
    Code:
      stack=2, locals=1, args_size=1
         0: new           #2                  // class com/yx/demo/NewDemo
         3: dup
         4: invokespecial #3                  // Method "<init>":()V
         7: areturn
      LineNumberTable:
        line 9: 0
      LocalVariableTable:
        Start  Length  Slot  Name   Signature
            0       8     0  this   Lcom/yx/demo/NewDemo;

指令

含义

0:new

创建一个对象,并将其引用值压入栈顶(在堆内存中分配一块区域,并将该区域地址引用压入栈顶)

3:dup

复制栈顶数值并将复制值压入栈顶,也就是说此时操作数栈上有连续相同的两个对象地址;

4: invokespecial

调用超类构造方法,实例初始化方法(调用<init>()方法),注意这个方法是一个实例方法,所以需要从操作数栈顶弹出一个引用,也就是说这一步会弹出一个之前入栈的对象地址;

7: areturn

从操作数栈顶取出一个引用类型的值,从当前方法返回该引用

  几乎每new一个对象,都包含new、dup、invokespecial这个三个指令,从指令含义中能体现jvm创建对象的部分过程,比如new指令在堆内存创建一个区域,即分配内存地址。(注意:由反编译可知,一个简单的new NewDemo()由三个指令完成,由此可见new对象不是原子操作,并不是一个jvm指令代表一个原子操作,jvm是跨平台的jvm指令合集,原子操作是相对CPU而言的,这里记住new对象非原子操作,可能会带来线程安全问题 指令重排序问题,可对标单例模式双重校验锁)