本文主要对Java程序的执行模式和JVM的架构原理进行较易理解的介绍和剖析,以便能更好的掌握Java的核心机制和基本原理,抛砖引玉,以便引起Java爱好这的兴趣。如果觉得有用,请点个赞,顺手分享本文。Thanks a lot.
一、Java程序的两个环境
所谓Java程序,即用Java语言编写的程序,它包含数据、代码以及相关算法。而一个有效的java程序,满足两个环境的要求,即编译环境和运行环境。如下图所示:
图-1:Java程序运行环
根据上图所示:
其一,在编译环境中,我们基于Java语言和JDK(Java开发工具包),进行源程序的代码编写,并在确保正确的情况下,通过工具包提供编译器,把所有源代码(即.java)编译成(通过javac命令实现)字节码文件(即.class文件)。
其二,在运行时环境执行程序,或说运行程序。这时,需要先拥有待运行程序的字节码文件。这些字节码文件有可能通过网络或者在本地两种方式传递到运行时环境。
运行时环境中主要的工作就是启动Java虚拟机,并通过虚拟机来完成一系列工作,实现java程序的运行。需要注意的是,在java虚拟执行程序时,它会根据需要来加载Java提供的相关API的class文件。
二、Java的JVM运行结构
基于上面的java程序运行的框架图,我们进一步来透视java的核心基石,即java虚拟机JVM的内部运行组成。
根据Java的虚拟机规范,JVM内部抽象体系结构主要有这样几大部分组成,即类装载器子系统、执行引擎以及运行时数据管理区,同时要求支持本地方法的调用机制。那么这样一来,我们进一步细化Java程序的JVM内部执行机制,就形成如下的Java运行模式架构:
图-2:JVM运行流程结构图
三、JVM的架构原理和运行机制
经过上一部分的内容的抽象和总结,那么我们可以进一步抽象出基于java虚拟机规范实现的一般的JVM实现组成架构以及其运行机制和原理。JVM详细的参考架构图如下:
图-3:虚拟机JVM参考实现图
针对上图JVM参考架构,作简要说明如下:
虚拟机JVM主要有三个子系统构成:
1-类装入器子系统
2-运行时数据区
3-执行引擎
1.类装入器子系统
Java的动态类加载功能是由类装入器子系统。 由他进行类的装载、链接、并初始化类文件时,是指一个类第一次运行时,而不是编译时间。
1.1类加载
1)Bootstrap类加载器
负责加载$JAVA_HOME中jre/lib/rt.jar里所有的class,由C++实现,不是ClassLoader子类
2)Extension类加载器
负责加载java平台中扩展功能的一些jar包,包括$JAVA_HOME中jre/lib/*.jar或-Djava.ext.dirs指定目录下的jar包
3)Application类加载器
负责记载classpath中指定的jar包及目录中class
4)Custom类加载器
属于应用程序根据自身需要自定义的ClassLoader,如tomcat、jboss都会根据j2ee规范自行实现ClassLoader。加载过程中会先检查类是否被已加载,检查顺序是自底向上,从Custom ClassLoader到BootStrap ClassLoader逐层检查,只要某个classloader已加载就视为已加载此类,保证此类只所有ClassLoader加载一次。而加载的顺序是自顶向下,也就是由上层来逐层尝试加载此类。
1.2连接
验证——字节码校验器会检查生成的字节码是否正确,如果验证失败则会验证错误。
准备——对于所有静态变量的内存分配和默认值分配。
识别——解析或识别是从运行时常量池的符号引用中动态具体值的过程。
1.3初始化
这是类装入的最后阶段, 类或接口的初始化由执行类或接口初始化方法构成。这里所有的静态变量与原来的值将被指派,静态块将被执行。
2.运行时数据区
运行时数据区域分为5个主要组件:
方法区——所有的类级别的数据将存储在这里,包括静态变量。 每个JVM区域只有一个方法,它是一个共享资源。一般会包含一个运行时常量池(运行时常量池:一个存储了类文件格式中的常量池表的内存空间。这部分空间虽然存在于方法区内,但却在JVM操作中扮演着举足轻重的角色,因此JVM规范单独把这一部分拿出来描述。除了每个类或接口中定义的常量,它还包含了所有对方法和字段的引用。因此当需要一个方法或字段时,JVM通过运行时常量池中的信息从内存空间中来查找其相应的实际地址)。
堆区域——所有的对象和相应的实例变量和数组将存储在这里。 还有一堆区域每个JVM。 自方法和堆区域多个线程共享内存,存储的数据不是线程安全的。
栈区域——每一个线程创建一个单独的运行时堆栈。 对于每一个方法调用,一个称为栈内存栈帧被创建。 所有局部变量将被创建在栈内存中。 栈区域是线程安全的,因为它不是一个共享资源。 栈帧分三个实体:
其一,局部变量数组——有多少相关的方法局部变量以及相应的值将被存储在这里。
其二,操作数栈——如果任何中间操作要求执行,操作数栈作为运行时工作区执行操作。
其三,帧数据——所有的符号对应的方法存储在这里。 在任何的情况下异常catch块信息将保存在帧数据。
程序计数器——每个线程必须分开程序计数器登记,当前执行的指令一旦执行,程序计数器(程序计数登记器)更新下一个指令。
本地方法栈——本地方法栈保存本机方法的信息。 为每一个线程将创建一个单独的本地方法栈,以备不时之用。
3.执行引擎
通过类装载器装载的,被分配到JVM的运行时数据区的字节码会被执行引擎执行。执行引擎以指令为单位读取Java字节码。它就像一个CPU一样,一条一条地执行机器指令。每个字节码指令都由一个1字节的操作码和附加的操作数组成。执行引擎取得一个操作码,然后根据操作数来执行任务,完成后就继续执行下一条操作码。如下图所示:
不过Java字节码是用一种人类可以读懂的语言编写的,而不是用机器可以直接执行的语言。因此,执行引擎必须把字节码转换成可以直接被JVM执行的语言。字节码可以通过以下两种方式转换成合适的语言。执行引擎主要包括3部分内容:
(1)解释器:一条一条地读取,解释并且执行字节码指令。因为它一条一条地解释和执行指令,所以它可以很快地解释字节码,但是执行起来会比较慢。这是解释执行的语言的一个缺点。字节码这种“语言”基本来说是解释执行的。
(2)即时(Just-In-Time)编译器:即时编译器被引入用来弥补解释器的缺点。执行引擎首先按照解释执行的方式来执行,然后在合适的时候,即时编译器把整段字节码编译成本地代码。然后,执行引擎就没有必要再去解释执行方法了,它可以直接通过本地代码去执行它。执行本地代码比一条一条进行解释执行的速度快很多。编译后的代码可以执行的很快,因为本地代码是保存在缓存里的。
不过,用JIT编译器来编译代码所花的时间要比用解释器去一条条解释执行花的时间要多。因此,如果代码只被执行一次的话,那么最好还是解释执行而不是编译后再执行。因此,内置了JIT编译器的JVM都会检查方法的执行频率,如果一个方法的执行频率超过一个特定的值的话,那么这个方法就会被编译成本地代码。JIT中不要构成如下:
²中间代码生成器(Intermediate Code Generator):生成中间代码
²代码优化器(Code Optimizer):负责优化上面生成的中间代码
²目标代码生成器(Target Code Generator):负责生成机器代码或本地代码
²分析器(Profiler):一个特殊组件,负责查找热点,即该方法是否被多次调用;
可以简单这样理解,JIT编译器通过中间代码生成器生成中间代码,再通过代码优化器负责优化生成中间代码,最后由目标代码生成器负责生成机器代码或本机代码。在这过程中,JIT的分析器,一个特殊的组件,负责寻找热点,即是否多次调用的方法,再执行上述操作。
(3)垃圾收集器(Garbage Collector):收集和删除未引用的对象。可以通过调用System.gc()触发垃圾收集,但不能保证执行。JVM的垃圾回收对象是已创建的对象。
另外,Java Native Interface(JNI): JNI将与本机方法库进行交互,并提供执行引擎所需的本机库。本地方法库(Native Method Libraries)是执行引擎所需的本机库的集合。