为什么java编译器不能编译汉字

转载

云端筑梦者 2024-11-06 16:11:38

文章标签 为什么java编译器不能编译汉字编译器优化 jvm 编译器泛型 文章分类 Java 后端开发

一概述

本文属于《深入理解java虚拟机》读书笔记系列，属于第四部分。这一块平时编码接触不多，更是从提高性能的角度去理解。作者分成两章来介绍。我自己是大概这样想的，整理完这两章，本书后面的高效并发系列单独来整理，我觉得可能限于篇幅，本书的侧重点不在并发这一段。

java语言的“编译器”其实是一段“不确定”的操作系统，因为他可能是指一个前段编译期把*.java文件转化为*.class文件的过程；也可能是指虚拟机的后端运行期编译器（JIT编译器）把字节码转变为机器码的过程；还可能是指使用静态提前编译器（AOT编译器）直接把*.java文件编译成本地机器代吗的过程。

前端编译器：Sun的Javac、Eclipse JDE的增量式编译器（ECJ）。

JIT编译器：HotSpot VM的C1、C2编译器。

AOT编译器：GUN Compiler for the Java（GCJ）、Excelsior JET。

二javac编译器

本身使用Java语言编写

编译过程达成分为3个进程，分别是：

1）解析与填充符号表

3）分析与字节码生成过程

为什么java编译器不能编译汉字_编译器

2.1 解析与填充符号表

解析步骤包括了经典程序编译原理的词法分析和语法分析两个过程。

1）词法、语法分析

词法分析是将原代码的字节流转变为标记（Token）集合，单个字符是程序编写过程的最小元素，而标记则是编译过程的最小元素。

语法分析是根据Token序列构造构想抽象语法书的过程，抽象语法树是一种用来描述程序代码语法结构的树形表示方式，语法树的每一个节点都代表着程序代码中的一个语法结构。

2）填充符号表

符号表是由一组符号地址和符号信息构成的表格。符号表登记的信息在编译的不同阶段都要用到。

2.2 注解处理器

我们可以把它看做是一组编译器的插件，在这些插件里面，可以读取、修改、添加抽象语法树中的任意元素。如果这个插件在处理注解期间对语法树进行修改，编译器将回到解析及填充符号的过程重新处理，直到所有插入式注解处理器都没有在对语法树进行修改而已。

2.3 语义分析与字节码生成

语法分析之后，编译器获得了程序代码的抽象语法树表示，语法树能表示一个结构正确的源程序的抽象，但无法保证源程序的符合逻辑的。而语义分析的主要任务是对结构上正确的源程序进行上下文有关性质的审查，如进行类型审查。

Javac编译过程中，语义分析过程分为标注检查以及数据及控制流分析两个步骤。

1）标注检查

标注检查步骤检查的内容包括诸如变量使用前是否已被声明、变量与赋值之间的数据类型是否能够匹配等。

2）数据及控制流分析

3）解语法糖

语法糖，也称为糖衣语法，指计算机语言中添加的某种语法，这种语法对语言的功能并没有影响，但是更方便程序员使用。增加可读性。

Java中最常用的语法糖主要是前面提到过的泛型、变长参数、自动装箱/拆箱等，虚拟机运行时不支持这些语法，它们在编译阶段还原会简单的基础语法结构，这个过程叫解语法糖。

4）字节码生成阶段

字节码生成阶段不仅仅把前面的各个步骤所生成的信息转化成字节码写到磁盘中，编译器还进行少量的代码添加和转换工作。例如实例构造器<init>()方法和类构造器<clinit>()方法就是在这个阶段添加到语法树种的。

三语法糖的味道

3.1 泛型和类型擦除

泛型的本质是参数化类型的应用，也就是说所操作的数据类型被指定为一个参数。这种参数类型可以用在类、接口和方法的创建中，分别称为泛型类、泛型接口和泛型方法。

Java语言中的泛型，它只在程序源码中存在，在编译后的字节码文件中，就已经替换为原来的原声类型，并且在相应的地方插入了强制转型代码，所以泛型技术实际上是Java语言的一颗语法糖，Java语言中的泛型实现方法成为类型擦除，基于这种方法实现的泛型成为伪泛型。

3.2 自动装箱、拆箱与遍历循环

书上给了个例子。

public static void main(String[] args) {
		// TODO Auto-generated method stub
		Integer a =1;    
		Integer b =2;   
		Integer c =3; 
		Integer d =3; 
		Integer e =321; 
		Integer f =321; 
		Long g = 3L;
	    System.out.println(c==d);  	   
	    System.out.println(e==f);
	    System.out.println(c==(a+b));    	   
	    System.out.println(c.equals(a+b));   	  
	    System.out.println(g==(a+b));
	    System.out.println(g.equals(a+b));	        
	}

运行结果：

为什么java编译器不能编译汉字_编译器_02