Java的组成:

  • Java 由四方面组成:Java编程语言、Java类文件格式、Java虚拟机和Java应用程序接口(API)
  • 其中Java程序语言、Java虚拟机、JavaAPI类库这三个部分统称为JDK,JDK是用于支持Java程序开发的最小环境。
  • 把Java API类库中额Java SE API 子集和Java虚拟机这两部分统称为JRE,JRE是支持Java程序运行的标准环境。

java 原理图 java工作原理的组成部分_JVM

JVM的位置:

  • JVM处在核心位置,是程序与底层操作系统和硬件无关的关键。
  • JVM是在Java编译器和os平台之间的虚拟处理器。是一种基于下层的操作系统和硬件平台并利用软件方法来实现的抽象计算机。 Java编译器只需要面向JVM,生成JVM能理解的字节码。

java 原理图 java工作原理的组成部分_java 原理图_02

  • JVM 下方是移植接口,移植接口由两部分组成:适配器和Java操作系统。其中依赖于平台的部分称为适配器。
  • JVM在它的生存周期中有一个明确的任务,那就是运行Java程序,因此当Java程序 启动的时候,就产生JVM的一个实例。当程序运行结束时,实例也随之消失。

Java程序在JVM上运行的一般步骤:

1、Java源文件经编译器,编译成字节码(其中方法被编译为字节码指令)。

2、通过类加载器将字节码加载到虚拟机内存,并将字节码所代表的静态存储结构转化为方法区的运行时数据结构。

3、通过JVM解释器将每一条字节码指令翻译成特定平台上的机器码,然后通过特定平台运行。

Java虚拟机的体系结构:

每个JVM都有两种机制:

- 类装载子系统:装载具有适合名称的类或接口

  • 执行引擎:负责执行包含在已装载的类或接口中的指令

每个JVM包含内容

方法区、Java堆、Java栈、本地方法栈、指令计数器及其隐含寄存器

java 原理图 java工作原理的组成部分_java 原理图_03

Java代码编译和执行的整个过程:

Java代码编译是由Java源码编译器来完成,也就是Java代码到JVM字节码(.class文件)的过程。 流程图如下所示:

java 原理图 java工作原理的组成部分_java 原理图_04

Java字节码的执行是由JVM执行引擎来完成,流程图如下所示:

java 原理图 java工作原理的组成部分_Java_05

   此过程的三个重要机制:Java源码编译机制、类加载机制、类执行机制
Java源码编译机制:
  • 由以下三个过程组成:1)分析和输入到符号表 2)注释处理 3)语义分析和生成class文件
  • 最后生成的class文件由以下部分组成:
    1)结构信息包:括class文件格式版本号及各部分的数量与大小的信息;
    2)元数据:对应于Java源码中声明与常量的信息。包含类/继承的超类/实现的接口的声明信息、域与方法声明信息和常量池;
    3)方法信息:对应Java源码中语句和表达式对应的信息。包含字节码、异常处理器表、求值栈与局部变量区大小、求值栈的类型记录、调试符号信息。
类加载机制:
  • 虚拟机把描述类的数据从Class文件加载到内存,并对数据进行校验、转换解析和初始化,最终形成可以被虚拟机直接使用的Java类型,这就是虚拟机的类加载机制。
  • 与那些在编译时需要进行连接工作的语言不同,在Java语言里,类型的加载、连接和初始化过程都是在运行期间完成的,这种策略虽然会令类加载时稍微增加了一些性能开销,但是会为Java应用程序提供高度的灵活性,Java里天生可以动态扩展的语言特性就是依赖运行期动态加载和动态连接这个特点实现的。

java 原理图 java工作原理的组成部分_初始化_06

初始化

什么情况下需要开始类加载过程的第一个阶段:加载?Java虚拟机规范并没有强制约束,这点依赖虚拟机的具体实现。

但是对于初始化阶段,虚拟机规范则严格规定了如下几种情况必须立即进行”初始化”(而加载、验证、准备自然需要在此之前开始)

1、使用new关键字实例化对象的时候、读取或设置一个类的静态字段的时候(被final修饰,已在编译期把结果放入常量池的静态字段除外),以及调用一个类的静态方法的时候。

2、使用java.lang.reflect包的方法对类进行反射调用的时候,如果类没有进行过初始化,则需要先触发其初始化。

3、当初始化一个类的时候,如果发现其父类还没有进行过初始化,则需要先触发其父类的初始化。

4、当虚拟机启动时,用户需要指定一个要执行的主类(包含main()方法的那个类),虚拟机会先初始化这个主类。

以上场景中的行为称为对一个类的主动引用。除此之外,所有引用类的方式都不会触发初始化,称为被动引用。

接口的加载过程和类加载过程稍微有些不同。

接口与类真正区别在于:当一个类在初始化时,要求其父类全部都已经初始化过了,但是一个接口在初始化时,并不要求其父接口全部都完成了初始化,只有在真正使用到父接口的时候(如引用接口中定义的常量)才会初始化。

  • JVM的类加载是通过ClassLoader及其子类来完成的,类的层次关系和加载顺序可以由下图来描述:

java 原理图 java工作原理的组成部分_Java_07

  1. Bootstrap ClassLoader负责加载$JAVA_HOME中jre/lib/rt.jar里所有的class,由C++实现,不是ClassLoader子类
  2. Extension ClassLoader负责加载java平台中扩展功能的一些jar包,包括$JAVA_HOME中jre/lib/*.jar或-Djava.ext.dirs指定目录下的jar包
  3. App ClassLoader负责记载classpath中指定的jar包及目录中class
  4. Custom ClassLoader属于应用程序根据自身需要自定义的ClassLoader,如tomcat、jboss都会根据j2ee规范自行实现ClassLoader
类执行机制:
  • JVM是基于堆栈的虚拟机。JVM为每个新创建的线程都分配一个堆栈.也就是说,对于一个Java程序来说,它的运行就是通过对堆栈的操作来完成的。堆栈以帧为单位保存线程的状态。JVM对堆栈只进行两种操作:以帧为单位的压栈和出栈操作。
  • JVM执行class字节码,线程创建后,都会产生程序计数器(PC)和栈(Stack),程序计数器存放下一条要执行的指令在方法内的偏移量,栈中存放一个个栈帧,每个栈帧对应着每个方法的每次调用,而栈帧又是有局部变量区和操作数栈两部分组成,局部变量区用于存放方法中的局部变量和参数,操作数栈中用于存放方法执行过程中产生的中间结果。栈的结构如下图所示:
  • java 原理图 java工作原理的组成部分_Java_08

JVM内存管理

  • JVM内存结构分为:方法区(method),栈内存(stack),堆内存(heap),本地方法栈(Java中的jni调用),结构图如下所示:

java 原理图 java工作原理的组成部分_JVM_09

堆内存
  • 所有通过new创建的对象的内存都在堆中分配,其大小可以通过-Xmx和-Xms来控制。
  • 操作系统有一个记录空闲内存地址的链表,当系统收到程序的申请时,会遍历该链表,寻找第一个空间大于所申请空间的堆结点,然后将该结点从空闲结点链表中删除,并将该结点的空间分配给程序,另外,对于大多数系统,会在这块内存空间中的首地址处记录本次分配的大小,这样代码中的delete语句才能正确的释放本内存空间。但由于找到的堆结点的大小不一定正好等于申请的大小,系统会自动的将多余的那部分重新放入空闲链表中。这时由new分配的内存,一般速度比较慢,而且容易产生内存碎片,不过用起来最方便。
  • 另外,在WINDOWS下,最好的方式是用VirtualAlloc分配内存,它不是在堆,也不是在栈,而是直接在进程的地址空间中保留一块内存,虽然这种方法用起来最不方便,但是速度快,也是最灵活的。
  • 堆内存是向高地址扩展的数据结构,是不连续的内存区域。由于系统是用链表来存储的空闲内存地址的,自然是不连续的,而链表的遍历方向是由低地址向高地址。堆的大小受限于计算机系统中有效的虚拟内存。由此可见,堆获得的空间比较灵活,也比较大。
栈内存
  • 在Windows下, 栈是向低地址扩展的数据结构,是一块连续的内存区域。
  • 栈顶的地址和栈的最大容量是系统预先规定好的,在WINDOWS下,栈的大小是固定的(是一个编译时就确定的常数),如果申请的空间超过栈的剩余空间时,将提示overflow。
  • 因此,能从栈获得的空间较小。只要栈的剩余空间大于所申请空间,系统将为程序提供内存,否则将报异常提示栈溢出。 由系统自动分配,速度较快。但程序员是无法控制的。

堆内存与栈内存需要说明:

++基础数据++类型直接在栈空间分配,++方法的形式参数++,直接在栈空间分配,当方法调用完成后从栈空间回收。引用数据类型,需要用new来创建,既在栈空间分配一个地址空间,又在堆空间分配对象的类变量 。++方法的引用参数++,在栈空间分配一个地址空间,并指向堆空间的对象区,当方法调用完成后从栈空间回收。局部变量new出来时,在栈空间和堆空间中分配空间,当局部变量生命周期结束后,栈空间立刻被回收,堆空间区域等待GC回收。方法调用时传入的literal参数,先在栈空间分配,在方法调用完成后从栈空间收回。字符串常量、static在DATA区域分配,this在堆空间分配。数组既在栈空间分配数组名称,又在堆空间分配数组实际的大小。

java 原理图 java工作原理的组成部分_初始化_10

  • 个人小结:new操作的是在堆开辟控件,而引用和一般的基础数据类型是在栈空间分配。
本地方法栈(Java中的jni调用)
  • 用于支持native方法的执行,存储了每个native方法调用的状态。对于本地方法接口,实现JVM并不要求一定要有它的支持,甚至可以完全没有。Sun公司实现Java本地接口(JNI)是出于可移植性的考虑,当然我们也可以设计出其它的本地接口来代替Sun公司的JNI。但是这些设计与实现是比较复杂的事情,需要确保垃圾回收器不会将那些正在被本地方法调用的对象释放掉。
  • 个人小结:看不懂 >_<
方法区
  • 它保存方法代码(编译后的java代码)和符号表。存放了要加载的类信息、静态变量、final类型的常量、属性和方法信息。JVM用持久代(Permanet Generation)来存放方法区,可通过-XX:PermSize和-XX:MaxPermSize来指定最小值和最大值。

Java虚拟机的运行过程示例

上面对虚拟机的各个部分进行了比较详细的说明,下面通过一个具体的例子来分析它的运行过程。

虚拟机通过调用某个指定类的方法main启动,传递给main一个字符串数组参数,使指定的类被装载,同时链接该类所使用的其它的类型,并且初始化它们。例如对于程序:

java 原理图 java工作原理的组成部分_java 原理图_11

编译后在命令行模式下键入: java HelloApp run virtual machine

将通过调用HelloApp的方法main来启动java虚拟机,传递给main一个包含三个字符串”run”、”virtual”、”machine”的数组。现在我们略述虚拟机在执行HelloApp时可能采取的步骤。

开始试图执行类HelloApp的main方法,发现该类并没有被装载,也就是说虚拟机当前不包含该类的二进制代表,于是虚拟机使用ClassLoader试图寻找这样的二进制代表。如果这个进程失败,则抛出一个异常。类被装载后同时在main方法被调用之前,必须对类HelloApp与其它类型进行链接然后初始化。链接包含三个阶段:检验,准备和解析。检验检查被装载的主类的符号和语义,准备则创建类或接口的静态域以及把这些域初始化为标准的默认值,解析负责检查主类对其它类或接口的符号引用,在这一步它是可选的。类的初始化是对类中声明的静态初始化函数和静态域的初始化构造方法的执行。一个类在初始化之前它的父类必须被初始化。整个过程如下:

![]( 
 )

掌握一定知识后,进一步阅读:Java JVM 运行机制及基本原理


字节码

  • Java语言中,程序编译后生成的是字节码而不是机器码。字节码不包含任何平台相关的信息,故具有平台无关性。
  • Java虚拟机的语言无关性。Java虚拟机不和包括Java语言在内的任何语言绑定,它只与“Class文件”这种特定的二进制文件格式所关联,也就是说,虚拟机并不关心Class(描述类静态结构的字节码)的来源是何种语言。

java 原理图 java工作原理的组成部分_类加载器_12