程序员编写的Java源文件(.java)经过编译,生成字节码文件(.class)。

Java程序的运行需要JVM(Java虚拟机,Java Virtual Machines)支持。JVM是一个软件,安装在操作系统中,为字节码文件提供运行环境。

Java官方提供了针对不同平台的JVM软件(比如JVM  for Linux, JVM for Windows等),只要是标准的字节码文件,就可以在不同的JVM上运行且运行效果相同,这就是一次编程到处使用(也是Java程序的一个明显优点)。

而其它语言,如C语言的源文件会直接生成可执行文件,可以直接在操作系统中运行。


对于Java源文件经过编译生成的字节码文件如何被只认识0和1的电脑识别并运行,非常好奇,经过几次学习,终于对字节码的规范有了初步了解。


后面会以每个程序员的第一个程序HelloWorld(加上简单的变量)为例,尝试分析下字节码文件。


HelloWorld的源码:

package day02;

public class HelloWorld {
	
	public static void main(String[] args) {
		String str = "Hello World!";
		System.out.println(str);

	}

}




 

编译器使用的是JDK 1.8:

 

打开字节码文件(我使用EditPlus打开,中间会让选择encoding,使用下图所示”Hex viewer”即可)

提示Failed to open document,但点击确定后可正确打开字节码文件。

字节码打开如下图。

红色框内的部分就是HelloWorld.class的内容,其它部分是EditPlus自动生成的:红色框左边部分代表行号,右侧部分是二进制码对应的字符(utf-8编码)

 

要明白 HelloWorld.java 和 HelloWorld.class 文件是如何对应的,我们必须对 JVM 的字节码规范有所了解。字节码文件的结构非常紧凑,没有任何冗余的信息,连分隔符都没有,它采用的是固定的文件结构和数据类型来实现对内容的分割的。字节码中包括两种数据类型:无符号数和表。无符号数又包括 u1,u2,u4,u8四种,分别代表1个字节、2个字节、4个字节和8个字节。而表结构则是由无符号数据组成的。