Java代码的执行


学习java都知道,Java代码需要经过编译和解释两个步骤,才在能在平台上运行。首先java语言的编译器,帮java代码编译成class的字节码,之后通过java虚拟机(JVM)来解释执行。这里有几个问题:


1.java代码是如何编译的?


首先编译的解释:把用高级程序设计语言书写的源程序,翻译成等价的计算机汇编语言或机器语言书写的目标程序翻译程序。编译的具体过程,可以看看《编译原理》相关的书籍。


其实java的编译过程,和通常c/c++还是不同的。

java的编译


java编译后的字节码文件格式主要分为两部分:常量池和方法字节码。常量池记录的是代码出现过的所有token(类名,成员变量名等等)以及符号引用(方法引用,成员变量引用等等);方法字节码放的是类中各个方法的字节码。


Java编译器却不将对变量和方法的引用编译为数值引用,也不确定程序执行过程中的内存布局,而是将些符号引用信息保留在字节码中,由解释器在运行过程中创立内存布局,然后再通过查表来确定一个方法所在的地址,这样就有效地保证了java的可移植性和安全性。


c/c++的编译


当C编译器编译生成一个对象的代码时,该代码是为在某一特定硬件平台运行而生成的。因此在编译过程中,编译程序通过查表将所有对符号的引用转换为特定的内存偏移量,以保证程序运行。


总结就是:


java代码编译之后,可以直接运行在Windows或者其它装有JVM虚拟机的系统下。而C或C++直接编译成与机器和操作系统相关的代码。

所以C语言编译的程序没有跨平台性,就算没有使用到操作系统相关的API,在不同的系统下也必须重新编译才能运行。


2.java虚拟机(JVM)是什么,怎样解释java class字节码?


简单的可以这样理解它的功能:就是讲java编译之后的字节码,解释成cpu能够执行的二进制代码。


JVM是一个虚构出来的计算机,是通过在实际的计算机上仿真模拟各种计算机功能来实现的。JVM有自己完善的硬件架构,如处理器、堆栈、寄存器等,还具有相应的指令系统。JVM 的主要工作是解释自己的指令集(即字节码)并映射到本地的 CPU 的指令集或 OS 的系统调用。Java语言是跨平台运行的,其实就是不同的操作系统,使用不同的JVM映射规则,让其与操作系统无关,完成了跨平台性。JVM 对上层的 Java 源文件是不关心的,它关注的只是由源文件生成的类文件( class file)。类文件的组成包括 JVM 指令集,符号表以及一些补助信息。


java虚拟机工作的原理,可以自己找一下网上的资料。大家还需要思考的问题,jvm的内存、jvm的垃圾回收(GC)、Android的朋友还要区分(Dalvik 和标准 Java 虚拟机JVM)的区别。








java  应用可以打包成jar 格式, jar格式其实只是一种很普通的压缩格式,与zip格式一样,只不过是它会在压缩文件的目录结构中增加一个META-INF/ MANIFEST.MF 的元文件。

我们知道,经过编译的字节码class文件可以直接放到java虚拟机去解释执行(JIT方式), 我们通过在命令行调用“java  class文件的路径”就可以使用jvm(java.exe/javaw.exe)来解释执行这些字节码文件。   

我们知道,java源代码(.java文件)经过java编译器javac编译以后,会得到java的字节码的中间语言文件,也就是我们通常所说的类文件(.class文件),这些类文件会按照java源文件的包结构分目录存放,jar 命令的作用就是按照这种包目录结构打包这些字节码的class文件,形成一个jar包,并且增加一个META-INF/ MANIFEST.MF 的元文件 。这样打包的jar文件的确是包含了按照包目录结构存放的字节码class文件,但是这时候如果你在命令行:jar -jar  a.jar 的话,会提示你指定一个主类,这是因为,虽然jar包里面包含了按照包目录结构存放的字节码class文件,但是却并不知道主类(含有 public static void main(String[])入口 方法的类)的位置,所以需要你手动的指定主类,然后才可以开始执行。当然, 只需要在打包jar文件的时候,将主类的信息包含进去了以后,再:jar -jar  a.jar 的话, 就不需要手动的指出主类是哪个类了。进行如下操作:新建一个.mf文件,名字任意,例如:manifest.mf ,在里面指定主类是哪个类,即:写入一行 :Main-Class: test.Test。然后,打包: jar  cvfm test.jar manifest.mf test; 这样打成的包test.jar里面就已经包含主类是哪个类的信息了。这样的话,在命令行里面直接执行:jar -jar    test.jar 就可以运行该应用了,这种情况下, jvm会去这个class文件的包中寻找入口函数如何进入执行。


jdk 相关过程原理分析。

我们知道,在jdk的bin目录下有很多的exe文件,例如java.exe, javac.exe, javadoc.exe等。 这些exe文件格式实质上是windows操作系统下的可执行文件格式(在dos下还有一种可执行可是是.com后缀的格式,不过现在已经不常见了),它们是由C语言写成的.c文件经过编译后生成的。例如:java.exe对应的源码就是java.c文件。java.c的main入口函数中会调用函数:CreateExecutionEnvironment,该函数中会查找jre路径,然后根据jvm.cfg配置文件配置的虚拟机动态链接库(jvm.dll)路径参数装载jvm.dll动态连接库,也就是加载java虚拟机(java虚拟机是C++写的,也有部分C代码),然后初始化jvm.dll(所有的dll都是本地语言写成的), 并挂接到JNIEnv(JNI调用接口)实例,最后调用JNIEnv实例装载并处理class类。由上面的分析我们可以看到,windows操作系统下的exe文件大部分情况下是使用windows本地语言所写的代码编译而成的的,这些exe文件用于完成一定的功能,例如java.exe, 可以用来查找并加载jvm.dll ,然后通过调用jvm.dll 的  接口来加载java的字节码中间语言文件.class文件,并启动java应用程序。 或者完成其它的一些功能等。exe文件也可能是本地语言代码生成的exe文件与jar包压缩而成的。

更加方便的方法是,将jar做成exe。例如eclipse 就是一个java 应用程序,就采用了 使用exe来wrapper。

 wrapper 基本原理: 在本地化语言(C或者C++等)代码中调用jvm.dll,然后通过jvm.dll提供的接口加载压缩在一起的jar包中的主类class的入口方法( static void main(String args[]), 从而启动java应用程序,这种加壳方式形成的java应用的exe文件在启动的时候会表现为一个exe进程,这种方式更常见。(形式是一个由本地化语言exe和jar包一起压缩而成的一个exe文件);也可以在本地化语言(C或者C++等)代码中调用java.exe/javaw.exe进程(java.exe进程会执行前一种方法的步骤来完成jvm.dll的加载)来加载jvm.dll,然后通过jvm.dll提供的接口加载压缩在一起的jar包中的主类class的入口方法( static void main(String args[]), 从而启动java应用程序,这种加壳方式形成的java应用的exe文件在启动的时候会表现为一个exe进程和一个javaw进程。(形式是一个由本地化语言exe和jar包一起压缩而成的一个exe文件,当然,也可以选择不将jar文件和本地exe文件压缩在一起);

这两种根本上都是通过本地代码来加载java虚拟机,然后在本地代码中通过调用jvm.dll的接口来完成class主文件的加载和java应用的启动的。

JNI_CreateJavaVM这个导出函数来创建Java虚拟机,得到JNIEnv指针,然后调用FindClass查找Main Class,之后调用GetStaticMethodID方法得到main方法,并执行main方法。   

将Java应用程序的class目录结构打包为jar文件,并与本地代码exe文件合并:在Dos提示符下执行copy命令:



C:/>copy test.exe+test.jar test.exe



其实,就是将Java打包文件追加到exe文件尾部。打开文件属性对话框,可看到有“压缩文件”属性页。



老牌的JBuilder.exe开发工具编译生成的exe文件即采用如下方式生成。



后记:大家在使用Eclipse 3.2和Eclipse 3.3时,在任务管理器中会看到二者的不同。



Eclipse 3.2是先启动Eclipse.exe文件,然后由Eclipse.exe启动Javaw.exe文件来创建虚拟机。



Eclipse 3.2在任务管理器中显示为Eclipse.exe和javaw.exe两个进程。



Eclipse 3.3在任务管理器中显示为Eclipse.exe一个进程。



从上面可以看出,Eclipse 3.2和Eclipse 3.3采用了不同的虚拟机加载方式。



 



Eclipse 3.2采用创建子进程的方法调用javaw.exe来启动,在windows下面可以用CreateProcess方法,此种方法较简单,具体可参见Eclipse源码。



 



Eclipse 3.3加载java虚拟机的另外一种方法是加载jvm的动态库,并通过动态库的接口来在本进程内启动java虚拟机。本文开头即采用的第二种方法。



 



写一个exe,调用java.exe来启动一个进程。

这很简单,启动vc,建一个win32 project,WinMain里使用ShellExecute函数即可,主要代码是:

#include "stdafx.h"
 #include "resource.h"int APIENTRY WinMain(HINSTANCE hInstance,
 HINSTANCE hPrevInstance,
 LPSTR lpCmdLine,
 int nCmdShow)
 {
 ShellExecute(NULL,"open",".//jre6//bin//javaw.exe","-ea -Dfile.encoding=GB18030 -Xmx600M -splash:res//splash.png -classpath /"./lib/*/" com.zms.laser.uis.Starter",".//",SW_SHOWNORMAL);
 return 0;
 }


要给编译出来的可执行程序一个图标,很简单,只要添加一个icon的资源,让这个icon的id最小即可。编译器会把具有最小id的icon当作最终exe的图标。

所有的给java 应用 加 exe 外壳的 工具软件 采用的都是以上原理中的一种。