1、什么是序列化
Java是面向对象的编程语言,有时需要保存对象,并在下次使用时可以顺利还原该对象。由于这种需求很常见,所以Java API对此提供了支持,添加相关程序代码到标准类库中,并将保存和还原的过程称之为“对象序列化”。
Java SE7 文档中将与对象序列化的相关内容做了详细表述,将其称为:
“Java对象序列化规范” Java Object Serialization Specification,网址为:
http://docs.oracle.com/javase/7/docs/platform/serialization/spec/serialTOC.html
2、为什么叫序列化
个人猜测:
由于保存对象的过程,是把对象保存为一连串字节流,而英文Serialization的意思“序列化”,所以序列化形象的表述了这个过程。
3、序列化保存那些内容
对象(object)是类(class)的一个实例(instance)。一个类中包含了变量(field)和函数(method)两个部分。同一个类的不同对象只是变量不同,所以Java API序列化过程中只保存了对象的变量部分。同样,由于静态变量(static field)是由同一个类的各个对象共用的,所以序列化过程中也不保存。
由于还原对象时需要在程序中动态创建该对象,所以程序也需要知道该对象的类定义,所以如果对象由一个程序序列化保存之后,由另外一个程序反序列化还原时,类文件也需要传送给该程序。这就需要扩展Java API序列化的功能,对其进行自定义。Java的远程方法调用(Remote Method Invocation, RMI)功能,就是以Java API序列化为基础,并进行了扩展。
3、序列化的用途
序列化主要有三个用途:
- 对象持久化(persistence)
对象持久化是指延长对象的存在时间。通常状况下,当程序结束时,程序中的对象不再存在。
如果通过序列化功能,将对象保存到文件中,就可以延长对象的存在时间,在下次程序运行是再恢复该对象。
序列化将对象保存在文件中,是实现对象持久化的一种方式。持久化还有很多种方式,比如Hibernate框架就提供了一整套对象持久化的方案。
- 对象复制
通过序列化,将对象保存在内存中,可以再通过此数据得到多个对象的副本。
- 对象传输
通过序列化,将对象转化字节流后,可以通过网络发送给另外的Java程序。
4、什么是流(Stream)
Java是面向对象的编程语言,对象是对现实实体的抽象表述。所以Java API中流(Stream)是对一连串数据的抽象,同时定义了一些操作,write和read等。所以现实实体,只要包含数据和对数据的读写操作都可以表示为流。OutputStream类和InputStream类,是2个抽象类,分别对应输出、输入流,所有其它流对象,都是其子类。
比如文件,文件本质是保存在存储设备中的一连串数据,在Java API中抽象为FileOutputStream类和FileInputStream类,文件的读写可以通过对相应流的读写实现的。
比如控制台中命令和结果的输入输出,键盘的输入是一串数据,程序的输出是一串数据,所以在Java API中也被抽象为流对象。控制台输入由System.in对象体现,System.in是类型为InputStream的对象。控制台输出由System.out对象体现,System.out是类型为PrintStream的对象。
由于文件和控制台输入输出都和操作系统有关,所以文件流和控制台流对象最终都是由Java虚拟机创建的。
ByteArrayOutputStream、ByteArrayInputStream,是完全不依赖Java虚拟机的流对象,其完全是对一个byte[]数组的抽象。因为byte[]数组也是一连串数据,byte[]数组支持读写功能,所以完全可以抽象为流对象,这可以从这两个类的源代码中看出。
4、使用序列化功能
在Java API中,对象序列化接口主要由两个类提供:ObjectOutputStream,ObjectInputStream。
为了满足保存到文件、内存、通过网络传输等不同需求,对象序列化后保存在流对象中。提供不同的流对象时,序列化后保存在相应流对象中。比如提供FileOutputStream和FileInputStream,就保存在文件中;提供ByteArrayOutputStream、ByteArrayInputStream,就保存在内存中。
由于Java API已经提供了实现序列化需要的相关代码,所以大部分情况下,使用序列化很简单。例如:
保存对象:
//创建一个流对象,比如文件输出流对象 FileOutputStream underlyingStream = new FileOutputStream("C:\\temp\\test"); //用刚才的文件流,创建一个对象序列化输出流 ObjectOutputStream serializer = new ObjectOutputStream(underlyingStream); //使用该流的输出函数,将对象序列化后保存到文件流中,也就是保存到了对应文件中。 serializer.writeObject(serializableObject); //创建一个流对象,比如文件输出流对象 FileOutputStream underlyingStream = new FileOutputStream("C:\\temp\\test"); //用刚才的文件流,创建一个对象序列化输出流 ObjectOutputStream serializer = new ObjectOutputStream(underlyingStream); //使用该流的输出函数,将对象序列化后保存到文件流中,也就是保存到了对应文件中。 serializer.writeObject(serializableObject);
读取对象,操作完全与保存是一一对应:
//创建一个流对象,比如文件输入流对象 FileInputStream underlyingStream = new FileInputStream("C:\\temp\\test"); //用刚才的文件流,创建一个对象序列化输入流 ObjectInputStream deserializer = new ObjectInputStream(underlyingStream); //使用该流的输入函数,将文件中保存的对象读取到内存中,并创建相应对象。 Object deserializedObject = deserializer.readObject( ); //创建一个流对象,比如文件输入流对象 FileInputStream underlyingStream = new FileInputStream("C:\\temp\\test"); //用刚才的文件流,创建一个对象序列化输入流 ObjectInputStream deserializer = new ObjectInputStream(underlyingStream); //使用该流的输入函数,将文件中保存的对象读取到内存中,并创建相应对象。 Object deserializedObject = deserializer.readObject( );
5、什么样的类可以序列化
不是所有的类都有序列化的必要,比如Thread类等,这些类中并没有必要保存的信息。这也是序列化没有成为Java内部功能的原因之一。所以,如果某个类需要序列化功能,类的定义中必须实现Serializable或者Externalizable接口。
比如Java API中的Character类:
public final class Character implements java.io.Serializable, Comparable<Character> public final class Character implements java.io.Serializable, Comparable<Character>
6、进一步的内容
进一步的内容比如transient关键字、自定义序列化机制、序列化版本控制等,请参考以下文章:
Java RMI Chapter 10 Serialization By William Grosso
http://oreilly.com/catalog/javarmi/chapter/ch10.html
Discover the secrets of the Java Serialization API by Todd Greanier
http://www.oracle.com/technetwork/articles/java/javaserial-1536170.html