1. 关于Java
Java是一种广泛使用的计算机编程语言,拥有跨平台、面向对象、泛型编程的特性,广泛应用于企业级Web应用开发和移动应用开发。
任职于Sun微系统的詹姆斯·高斯林等人于1990年代初开发Java语言的雏形,最初被命名为Oak,目标设置在家用电器等小型系统的编程语言,应用在电视机、电话、闹钟、烤面包机等家用电器的控制和通信。由于这些智能化家电的市场需求没有预期的高,太阳计算机系统(Sun公司)放弃了该项计划。
随着1990年代互联网的发展,Sun公司看见Oak在互联网上应用的前景,于是改造了Oak,于1995年5月以Java的名称正式发布。Java伴随着互联网的迅猛发展而发展,逐渐成为重要的网络编程语言。
Java编程语言的风格十分接近C++语言。继承了C++语言面向对象技术的核心,舍弃了容易引起错误的指针,以引用取代;移除了C++中的运算符重载和多重继承特性,用接口取代;增加垃圾回收器功能。在Java SE 1.5版本中引入了泛型编程、类型安全的枚举、不定长参数和自动装/拆箱特性。
Sun微系统对Java语言的解释是:“Java编程语言是个简单、面向对象、分布式、解释性、健壮、安全与系统无关、可移植、高性能、多线程和动态的语言”。
Java不同于一般的编译语言或解释型语言。它首先将源代码编译成字节码,再依赖各种不同平台上的虚拟机来解释执行字节码,从而具有“一次编写,到处运行”的跨平台特性。在早期JVM中,这在一定程度上降低了Java程序的运行效率。但在J2SE1.4.2发布后,Java的运行速度有了大幅提升。
现时,移动操作系统Android大部分的代码采用Java编程语言编程。
2006年SUN在JavaOne公布Java 开放源代码项目,并推出OpenJDK计划。Java虚拟机(JVM)、Java编译器和Java类库以GNU通用公共许可证公开。
1.1 JAVA的语言特性
Java之所以被开发,是要达到以下五个目的:
- 应当使用面向对象程序设计方法学
- 应当允许同一程序在不同的计算机平台执行
- 应当包括内建的对计算机网络的支持
- 应当被设计成安全地执行远端代码
- 应当易于使用,并借鉴以前那些面向对象语言(如C++)的长处。
(1)面向对象
“面向对象程序设计语言”的核心之一就是开发者在设计软件的时候可以使用自定义的类型和关联操作。
代码和数据的实际集合体叫做“对象”。一个对象可以想象成绑定了很多“行为(代码)”和“状态(数据)”的物体。对于数据结构的改变需要和代码进行通信然后操作,反之亦然。
面向对象设计让大型软件工程的计划和设计变得更容易管理,能增强工程的健康度,减少失败工程的数量。
(2)跨平台性
跨平台性是Java主要的特性之一,跨平台使得用Java语言编写的程序可以在编译后不用经过任何更改,就能在任何硬件设备条件下运行。这个特性经常被称为“一次编译,到处运行”。
执行Java应用程序必须安装Java 运行时环境(Java Runtime Environment,JRE),JRE包括Java虚拟机(Java Virtual Machine,JVM),以及Java平台核心类和基础Java 平台库。通过JVM才能在电脑系统执行Java应用程序(Java Application),这与**.Net Framework**的情况一样,所以电脑上没有安装JVM,那么这些java程序将不能够执行。
实现跨平台性的方法是大多数编译器在进行Java语言程序的编码时候会生成一个用字节码写成的“半成品”,这个“半成品”会在Java虚拟机(解释层)的帮助下运行,虚拟机会把它转换成当前所处硬件平台的原始代码。之后,Java虚拟机会打开标准库,进行数据(图片、线程和网络)的访问工作。主要注意的是,尽管已经存在一个进行代码翻译的解释层,有些时候Java的字节码代码还是会被JIT编译器进行二次编译。
有些编译器,比如GCJ,可以自动生成原始代码而不需要解释层。但是这些编译器所生成的代码只能应用于特定平台。并且GCJ目前只支持部分的Java API。
Java语言使用解释层最初是为了轻巧性。所以这些程序的运行效率比C语言和C++要低很多,用户也对此颇有微词。很多最近的调查显示Java的程序运行速度比几年前要高出许多,有些同样功能的程序的效率甚至超过了C++和C语言编写的程序。
Java语言在最开始应用的时候是没有解释层的,所有需要编译的代码都直接转换成机器的原始代码。这样做虽然使程序获得了最佳的性能,但是导致程序异常臃肿。从JIT技术开始,Java的程序都经过一次转换之后才变成机器码。很多老牌的第三方虚拟机都使用一种叫做“动态编译”的技术,也就是说虚拟机实时监测和分析程序的运行行为,同时选择性地对程序所需要的部分进行编译和优化。所有这些技术都改善了代码的运行速度,但是又不会让程序的体积变得失常。
程序的轻便性事实上是软件编写很难达到的一个目标,Java虽然成功地实现了“一次编译,到处运行”,但是由于平台和平台之间的差异,所编写的程序在转换代码的时候难免会出现微小的、不可察觉的错误和意外。有些程序员对此非常头疼,他们嘲笑Java的程序不是“一次编译,到处运行”,而是“一次编译,到处调试”。以Java AWT为例,早期Java AWT内提供的按钮、文字区等均是以计算机系统所默认的样式而显示。这令Java程序在有些没有提供图案的计算机系统产生错误(在Microsoft Windows设有窗口管理器,在一些Linux distribution则没有)。后来SUN公司针对Java AWT一些问题而推出Java Swing。
(3)自动垃圾回收(Garbage Collection)
C++语言被用户诟病的原因之一是大多数C++编译器不支持垃圾收集机制。通常使用C++编程的时候,程序员于程序中初始化对象时,会在主机存储器堆栈上分配一块存储器与地址,当不需要此对象时,进行析构或者删除的时候再释放分配的存储器地址。如果对象是在堆栈上分配的,而程序员又忘记进行删除,那么就会造成存储器泄漏(Memory Leak)。长此以往,程序运行的时候可能会生成很多不清除的垃圾,浪费了不必要的存储器空间。而且如果同一存储器地址被删除两次的话,程序会变得不稳定,甚至崩溃。因此有经验的C++程序员都会在删除之后将指针重置为NULL,然后在删除之前先判断指针是否为NULL。
C++中也可以使用“智能指针”(Smart Pointer)或者使用C++托管扩展编译器的方法来实现自动化存储器释放,智能指针可以在标准类库中找到,而C++托管扩展被微软的Visual C++ 7.0及以上版本所支持。智能指针的优点是不需引入缓慢的垃圾收集机制,而且可以不考虑线程安全的问题,但是缺点是如果不善使用智能指针的话,性能有可能不如垃圾收集机制,而且不断地分配和释放存储器可能造成存储器碎片,需要手动对堆进行压缩。除此之外,由于智能指针是一个基于模板的功能,所以没有经验的程序员在需要使用多态特性进行自动清理时也可能束手无策。
Java语言则不同,上述的情况被自动垃圾收集功能自动处理。对象的创建和放置都是在存储器堆栈上面进行的。当一个对象没有任何引用的时候,Java的自动垃圾收集机制就发挥作用,自动删除这个对象所占用的空间,释放存储器以避免存储器泄漏。
注意程序员不需要修改finalize方法,自动垃圾收集也会发生作用。但是存储器泄漏并不是就此避免了,当程序员疏忽大意地忘记解除一个对象不应该有的引用时,存储器泄漏仍然不可避免。
不同厂商、不同版本的JVM中的存储器垃圾回收机制并不完全一样,通常越新版本的存储器回收机制越快,IBM、BEA、SUN等等开发JVM的公司都曾宣称过自己制造出了世界上最快的JVM,JVM性能的世界纪录也在不断的被打破并提高。
IBM有一篇有关Java存储器回收机制比不激活垃圾收集机制的C++存储器处理快数倍的技术文章,而著名的Java技术书籍《Java编程思想》(Thinking in Java)也有一段论述Java存储器及性能达到甚至超过C++的章节。
(4)基本语法
编写Java程序前应注意以下几点:
- 大小写敏感:Java是大小写敏感的,这就意味着标识符Hello与hello是不同的。
- 类名:对于所有的类来说,类名的首字母应该大写。如果类名由若干单词组成,那么每个单词的首字母应该大写,例如
MyFirstJavaClass
。 - 方法名:所有的方法名都应该以小写字母开头。如果方法名含有若干单词,则后面的每个单词首字母大写,例如
myFirstJavaMethod
。 - 源文件名:源文件名必须和类名相同。当保存文件的时候,你应该使用类名作为文件名保存(切记Java是大小写敏感的),文件名的后缀为.java。(如果文件名和类名不相同则会导致编译错误)。
- 主方法入口:所有的Java程序由
public static void main(String[] args)
方法开始执行。
(5)Java关键字
下面列出了Java关键字。这些关键字不能用于常量、变量、和任何标识符的名称。
类别 | 关键字 | 说明 |
访问控制 | private | 私有的 |
protected | 受保护的 | |
public | 公共的 | |
类、方法和变量修饰符 | abstract | 声明抽象 |
class | 类 | |
extends | 扩允,继承 | |
final | 最终值,不可改变的 | |
implements | 实现(接口) | |
interface | 接口 | |
native | 本地,原生方法(非Java实现) | |
new | 新,创建 | |
static | 静态 | |
strictfp | 严格,精准 | |
synchronized | 线程,同步 | |
transient | 短暂 | |
volatile | 易失 | |
程序控制语句 | break | 跳出循环 |
case | 定义一个值以供switch选择 | |
continue | 继续 | |
default | 默认 | |
do | 运行 | |
else | 否则 | |
for | 循环 | |
if | 如果 | |
instanceof | 实例 | |
return | 返回 | |
switch | 根据值选择执行 | |
while | 循环 | |
错误处理 | assert | 断言表达式是否为真 |
catch | 捕捉异常 | |
finally | 有没有异常都执行 | |
throw | 抛出一个异常对象 | |
throws | 声明一个异常可能被抛出 | |
try | 捕获异常 | |
包相关 | import | 引入 |
package | 包 | |
基本类型 | boolean | 布尔型 |
byte | 字节型 | |
char | 字符型 | |
double | 双精度浮点 | |
float | 单精度浮点 | |
int | 整型 | |
long | 长整型 | |
short | 短整型 | |
null | 空 | |
变量引用 | super | 父类,超类 |
this | 本类 | |
void | 无返回值 | |
保留关键字 | goto | 是关键字,但不能使用 |
const | 是关键字,但不能使用 |
(6)接口和类别
Java自带了创建接口的类别,可以这样使用:
public interface Deleteable {
void delete();
System.out.println(" ATTACH DATABASE 'DatabaseName' As 'Alias-Name'");
}
这段代码的意思是任何实现(implement
)Deleteable接口的类别都必须实现delete()
方法。每个类别对这个方法的实现可以自行定制。由此概念可以引出很多种使用方法,下面是一个类别的例子:
public class Fred implements Deleteable {
// 必须写作Deleteable介面中的delete方法
@Override
public void delete() {
// 实际写的代码
}
// 这个类也可以包含其他方法
public void doOtherStuff() {
}
}
在另外一个类别中,可以使用这样的代码:
public void deleteAll(Deleteable [] list){
for(int i = 0; i < list.length; i++){
list[i].delete();
}
}
因为队列中所有的对象都可以使用delete()
方法。Deleteable队列中包含Fred对象的引用,而这个类别和其他Deleteable类别在使用deleteAll()
方法时候不需要进行任何改变。
之所以这样做就是为了在接口的执行和其代码之间进行区别。举例来说,一个名叫Collection
的接口可以包含任何对象所需要的引入、转换和存储数据的方法,其他的类都可以使用这个接口。但是这个接口可以是一个可重定义大小的队列、一个链表或者是其他功能的集合。
这种特性其实是一种折中的办法。Java的设计者们不想让Java有多重继承的特性,因为C++的多重继承显示了这种特性的困难。Java的接口功能可以提供同样的功能,但是又不会很复杂。
(7)应用程序开发接口
在Java语言中,应用程序接口(API)化身成类,并且分组成为包。每个包中包含有相关的接口和类。对于不同的平台,Java提供了不同版本的包。API的设定由sun公司和其他公司通过JCP(Java社区程序)决定。任何公司和个人都可以参与这个工程,对API进行设计。2004年,IBM和BEA公司准备联合对官方的Java开源软件工程进行支持,但是2005年初,sun公司拒绝了这个支持。
1.2 Java用途
1.桌面GUI应用程序:
Java通过抽象窗口工具包(AWT),Swing和JavaFX等多种方式提供GUI开发。虽然AWT包含许多预先构建的组件,如菜单,按钮,列表以及众多第三方组件,但Swing(一个GUI小部件工具包)还提供某些高级组件,如树,表格,滚动窗格,选项卡式面板和列表。JavaFX是一组图形和媒体包,提供了Swing互操作性,3D图形功能和自包含的部署模型,可以快速编写Java小应用程序和应用程序的脚本。[20]
2.移动应用程序:
Java Platform,Micro Edition(Java ME或J2ME)是一个跨平台框架,用于构建可在所有Java支持的设备(包括功能手机和智能手机)上运行的应用程序。此外,最受欢迎的移动操作系统之一的Android应用程序通常使用Android软件开发工具包(SDK)或其他环境在Java中编写脚本。
3.嵌入式系统:
从微型芯片到专用计算机的嵌入式系统是执行专门任务的大型机电系统的组件。诸如SIM卡,蓝光光盘播放器,公用事业仪表和电视机等多种设备都使用嵌入式Java技术。据甲骨文公司称,100%的蓝光光盘播放器和1.25亿台电视设备都采用Java技术。
4. Web应用程序:
Java通过Servlets,Struts或JSP提供对Web应用程序的支持。编程语言提供的简单编程和更高的安全性使得大量政府应用程序可用于基于Java的健康,社会安全,教育和保险。Java也可以使用Broadleaf等开源电子商务平台开发电子商务Web应用程序。
5. Web服务器和应用程序服务器:
今天的Java生态系统包含多个Java Web服务器和应用程序服务器。虽然Apache Tomcat,Simple,Jo !, Rimfaxe Web服务器(RWS)和Project Jigsaw占据了Web服务器空间,但WebLogic,WebSphere和Jboss EAP在商业应用服务器领域占据重要地位[21]。
6.企业应用程序:
Java企业版(Java EE)是一种流行的平台,为脚本和运行企业软件(包括网络应用程序和Web服务)提供API和运行时环境。甲骨文宣称Java在97%的企业计算机上运行。Java中更高的性能保证和更快的计算能力导致像Murex这样的高频交易系统被编入脚本中。它也是各种银行应用程序的中枢,它们将Java从前端用户端运行到后端服务器端。
7.科学应用:
Java是许多软件开发人员用于编写涉及科学计算和数学运算的应用程序的选择。这些程序通常被认为是快速和安全的,具有更高的便携性和低维护性。像MATLAB这样的应用程序使用Java来交互用户界面和作为核心系统的一部分。
2. JDK, Java开发工具包
**Java Development Kit(JDK)**是Sun微系统针对Java开发人员发布的免费软件开发工具包(SDK,Software development kit)。
自从Java推出以来,JDK已经成为使用最广泛的Java SDK。由于JDK的一部分特性采用商业许可证,而非开源。因此,2006年Sun微系统宣布将发布基于GPL的开源JDK,使JDK成为自由软件。在去掉了少量闭源特性之后,Sun微系统最终促成了GPL的OpenJDK的发布。
用途
作为Java语言的SDK,普通用户并不需要安装JDK来运行Java程序,而只需要安装JRE(Java Runtime Environment)。而程序开发者必须安装JDK来编译、调试程序。
包含组件
JDK包含了一批用于Java开发的组件,其中包括:
组件 | 说明 |
javac | 编译器,将后缀名为.java的源代码编译成后缀名为“.class”的字节码 |
java | 运行工具,运行.class的字节码 |
jar | 打包工具,将相关的类文件打包成一个文件 |
javadoc | 文档生成器,从源码注释中提取文档,注释需符合规范 |
jdb debugger | 调试工具 |
jps | 显示当前java程序运行的进程状态 |
javap | 反编译程序 |
appletviewer | 运行和调试applet程序的工具,不需要使用浏览器 |
javah | 从Java类生成C头文件和C源文件。这些文件提供了连接胶合,使Java和C代码可进行交互。[2] |
javaws | 运行JNLP程序 |
extcheck | 一个检测jar包冲突的工具 |
apt | 注释处理工具 |
jhat | java堆分析工具 |
jstack | 栈跟踪程序 |
jstat | JVM检测统计工具 |
jstatd | jstat守护进程 |
jinfo | 获取正在运行或崩溃的java程序配置信息 |
jmap | 获取java进程内存映射信息 |
idlj | IDL-to-Java编译器。将IDL语言转化为java文件[4] |
policytool | 一个GUI的策略文件创建和管理工具 |
jrunscript | 命令行脚本运行 |
JDK中还包括完整的JRE(Java Runtime Environment),Java运行环境,也被称为private runtime。包括了用于产品环境的各种库类,如基础类库rt.jar,以及给开发人员使用的补充库,如国际化与本地化的类库、IDL库等等。
JDK中还包括各种样例程序,用以展示Java API中的各部分。
常见的Java 8,说的就是 JDK 8.
JDK 版本 | 添加的功能 |
JDK 8 | lambdas函数;Collections & Streams |
JDK 9 | Collections;Streams; Optionals; Interfaces; JShell ; HTTPClient |
JDK 10 | Local-Variable Type Inference: var-keyword; |
JDK 11 | Strings & Files; Run Source Files; Local-Variable Type Inference (var) for lambda parameters |
JDK 12 | Unicode 11 support |
JDK 13 | Switch Expression; Multiline Strings |
JDK 14 | Switch Expression (Standard);Records (Preview) |
3. JRE,Java运行环境
Java运行环境(Java Runtime Environment,简称JRE)是一个软件,由Sun微系统所研发,JRE可以让电脑系统运行Java应用程序(Java Application)。
JRE的内部有一个Java虚拟机(Java Virtual Machine,JVM)以及一些标准的类别函数库(Class Library)。
4. JVM,Java虚拟机
Java虚拟机(英语:Java Virtual Machine,缩写为JVM),一种能够运行Java bytecode的虚拟机,以堆栈结构机器来进行实做。最早由Sun微系统所研发并实现第一个实现版本,是Java平台的一部分,能够运行以Java语言写作的软件程序。
Java虚拟机有自己完善的硬体架构,如处理器、堆栈、寄存器等,还具有相应的指令系统。JVM屏蔽了与具体操作系统平台相关的信息,使得Java程序只需生成在Java虚拟机上运行的目标代码(字节码),就可以在多种平台上不加修改地运行。通过对中央处理器(CPU)所执行的软件实现,实现能执行编译过的Java程序码(Applet与应用程序)。
作为一种编程语言的虚拟机,实际上不只是专用于Java语言,只要生成的编译文件符合JVM对加载编译文件格式要求,任何语言都可以由JVM编译运行。此外,除了甲骨文,也有其他开源或闭源的实现。
4.1 技术规范
Java虚拟机是一部抽象(虚拟)的计算机。但技术规范未定义使用的垃圾回收算法及优化Java虚拟机指令的内部算法,这主要是为了不给实现者带来过多困扰与限制。所有的Java程序仅可在对Java虚拟机的抽象技术规范的具体实现环境中才可运行。
自Java平台标准版(J2SE)5.0起,Java虚拟机的技术规范改为由Java社区流程开发制定(JSR 924)。2006年,JSR 924对技术规范进行了变更,支持更改类文件格式的提议(JSR 202)。Java虚拟机的技术细节以蓝皮书的形式发布,其前言称:
我们希望这份文档中的技术规范足以打造出相兼容的净室版Java虚拟机实现。甲骨文公司提供用于验证Java虚拟机实现是否正常运作的测试项目。
(1)类加载器
Java字节码的组织单位之一是类。类加载器实现必须识别并加载任何为Java类格式的文件。任何实现也可识别其他二进制文件,但必须识别类文件。
类加载器以下列严格顺序执行三个基础任务:
- 加载:寻找并导入特定类型的二进制数据;
- 链接:执行验证、准备及(可选)解析操作;
验证:确保导入类型的正确性。
准备:为类变量分配内存并初始化内存为默认值。
解析:将类型的符号引用转化为直接引用。
- 初始化:调用初始化类变量至正确起始值的Java代码。
通常而言,共有两种类加载器类型:引导类加载器(Bootstrap Class Loader)及用户定义类加载器(User Defined Class Loader)。
每款Java虚拟机实现均必须有加载受信类的引导类加载器。Java虚拟机技术规范不对类加载器寻找类的方式作出指定。
(2)虚拟机架构
Java虚拟机以原始值(整数及浮点数)及引用的方式运行,其本质上是一个32位的机器。64位的long和double类型数据被原生支持,但需要在帧的局部变量或操作数栈中占用两个存储单元(单个单元为32位)。
boolean、byte、short及char均为符号扩充类型(char使用零扩展),且以32位整数的形式(与int类型相同)运作。较小的数据类型仅有少量用于加载、存储于类型转换的特定指令。boolean类型被视为8位byte值,0代表false,1代表true。
(虽然《Java虚拟机规范第二版》阐明boolean被认为是一种数据类型,但除类型特征的名字修饰及boolean数组类型外boolean和byte无太大区别。boolean类型的方法签名为Z 而byte的类型签名为B。布尔型数组搭载数据类型boolean[],但每个元素使用8个字节,同时Java虚拟机不内置将布尔数据包装成位数组的功能,除此之外其与byte数组大同小异。在其他用途中,Java虚拟机实际上不知道boolean类型,因为用于操作布尔型数据的指令与操作byte的指令完全相同。)
也就是,JVM规范指出boolean当做int处理,也就是4字节,boolean数组当做byte数组处理,这样我们可以得出boolean类型占了单独使用是4个字节,在数组中是确定的1个字节。
Java虚拟机拥有用于存储对象及数组的垃圾回收堆。代码、常量及其他类数据均存储于“方法区”中。方法区逻辑上是堆的一部分,但虚拟机的实现可能会区分两者,从而可能不对方法区进行垃圾回收。每个Java虚拟机线程均有其自己的调用栈(Java虚拟机栈),用于存储帧。当调用方法时,Java虚拟机将新建一个帧;方法退出时,帧将自动消除。
每帧均提供一个“操作数栈”及一个“局部变量”数组。操作数栈用于计算操作数和接收被调用方法的返回值,而局部变量与寄存器的用途相同,也用于传递方法参数。故Java虚拟机既是堆栈机器,也是寄存器机。
(3)字节码指令
Java虚拟机拥有进行下列任务的指令集:
加载与存储;算术类型转换;创建并控制对象;操作数;栈管理(放入及拉出);控制转移(分支)方法调用并返回;抛出异常;基于监视器的并发
指令集存在的目的是为了保证二进制文件的兼容性。每个独立宿主操作系统需要对Java虚拟机及运行时环境的不同实现。这些Java虚拟机以相同方式语义解析字节码,但具体实现可能有所不同。比模拟字节码更复杂的是在兼容且高效的情况下实现必须映射至不同的宿主操作系统的Java核心API。
上述指令集通过操作共同的抽象数据类型执行命令,而非以使用特定指令集架构的原生数据类型的方式运行。
(4)Java虚拟机语言
Java虚拟机语言是指使用Java虚拟机托管的有效类文件来表示功能的任意编程语言。类文件中含有Java虚拟机指令集(Java字节码)、符号表及其他辅助信息。类文件是用于表达编译后的类及接口的二进制格式,与硬件及操作系统无关。
市面上有多种Java虚拟机语言,既有移植至Java虚拟机的旧语言,也有全新的语言。JRuby及Jython可能为最知名的移植语言之二;除此之外,也有从零编写的全新语言,如热门的Clojure、Apache Groovy、Scala及Kotlin。Java虚拟机语言的一大显著特征是都互相兼容,举例来说,Scala库可与Java程序互用,反之亦然。
以下为原生就在JVM上实现运行的语言:
BBj
BeanShell
Ceylon
Clojure
Fantom
Groovy
Java
Kotlin
MIDletPascal
Scala
Xtend
以下为实现了相应的JVM编译器的语言及其编译(解释)器,意味着下列语言可以使用基于Java开发的编译器进行编译或解释:
Erlang:Erjang
JavaScript:Rhino
Pascal:Free Pascal
PHP:Quercus
Python:Jython
REXX:NetRexx
Ruby:JRuby
Scheme:Kawa
Tcl:Jacl
5. 总结
参考:
- Wiki Java;
- Wiki JDK;
- Wiki JRE;
- Wiki Java虚拟机;
- Java中boolean类型到底占用多少个字节?;
- a-guide-to-java-versions-and-features