2.1 JVM中内存的划分
垃圾收集器对Java程序员来说,基本上是透明的,但是只有了解GC的工作原理、如何优化GC的性能、如何与GC进行有限的交互,才能提高整个应用程序的性能、全面提升内存的管理效率,为了说明其工作方式,我们首先看看内存中几种常用的存放数据的地方:
(1) 堆栈(Stack):位于常规RAM(随机访问存储器)区域,但可通过它的“堆栈指针”获得处理器的直接支持。堆栈指针若向下移,会创建新的内存;若向上移,则会释放那些内存。这是一种特别快、特别有效的数据保存方式,仅次于CPU的寄存器。创建程序时,Java编译器必须准确地知道堆栈内保存的所有数据的“长度”以及“存在时间”。这是由于它必须生成相应的代码,以便向上和向下移动指针。这一限制无疑影响了程序的灵活性,所以尽管有些Java数据要保存在堆栈里--特别是对象的引用(也可称为对象的引用变量),但Java中的对象不会放在其中。
(2) 堆(Heap)。一种常规用途的内存池(也在RAM区域),其中保存了Java对象。和堆栈不同,“内存堆”或“堆”(Heap)最吸引人的地方在于编译器不必知道要从堆里分配多少存储空间,也不必知道存储的数据要在堆里停留多长的时间。因此,用堆保存数据时会得到更大的灵活性。要求创建一个对象时,只需用new命令编制相关的代码即可。执行这些代码时,会在堆里自动进行数据的保存。当然,为达到这种灵活性,必然会付出一定的代价:在堆里分配存储空间时会花掉更长的时间!这是导致Java性能不佳的因素之一。
SUN的JVM使用分代方式(Generation)管理堆空间,“代”分配给新旧对象的内存池。这些对象的不断积累会导致一个的内存状态,从而推动垃圾收集的开始。如图说明了SUN的JVM中堆空间粗略的划分。
年轻的一代包括年轻的对象空间(eden)和两个存活(survivor)空间(SS#1和SS#2)。新对象被分配到eden中,那些存活较久的对象则会从年轻的一代转移到老一代中。图中的Perm段叫做永久代(permanent generation),它保存了JVM的类和方法对象。
(3) 静态存储(Static)。这儿的“静态”(Static)是指“位于固定位置”(尽管也在RAM里)或是有且仅有一份。程序运行期间,静态存储的数据将随时等候调用。可用static关键字指出一个对象的特定元素是静态的。但Java对象本身永远都不会置入静态存储空间。
2.2 对象在内存中的分配
了解了内存中这些存放数据的方式后,我们先来看看C++中存放对象的机制:在C++中,对象可以是在堆栈中创建的,这样可达到更快的速度。然而,在C++里创建“内存堆”(Heap)对象通常会慢得多。这种内存堆实际是一个大的内存池,要求必须进行再循环(再生)。这里可以把C++的Heap想象是一块场地,在这里面中每个对象不断监视属于自己的地盘,他们可能在以后的某个时刻不再继续占用目前所占用的空间,即释放后的内存会在堆里留下一个洞,所以再调用new的时候,存储分配机制必须进行某种形式的搜索,使新对象能够利用已经存在的空洞,否则就会很快用光堆的存储空间。之所以内存堆的分配会在C++里对性能造成如此重大的性能影响,对可用内存的搜索正是一个重要的原因。所以创建基于堆栈的对象要快得多。
而在Java中的内存堆(Heap)更像一条传送带:每次分配了一个新对象后,“Heap指针”都会朝前移动,这意味着对象存储空间的分配可以达到非常快的速度。因为“Heap指针”只是单纯的往前移动至未经分配的区域,所以它与C++的堆栈分配方式几乎是不相上下的(当然,在数据记录上会多花一些开销,但要比搜索存储空间快多了)。但是如果只是按那种方式分配,最终就要求进行大量的内存页面交换(这对性能的发挥会产生巨大干扰),而且终究会用光内存,出现内存分页错误(page fault)。所以Java引入了“垃圾收集器”。它在收集“垃圾”的同时,也负责重新紧密排列(compact)堆里的所有对象,消除内存空洞,将“堆指针”移至尽可能靠近传送带开头的地方,远离发生(内存)分页错误的地点。垃圾收集器会重新安排所有东西,使其成为一个高速、无限自由的堆模型,同时游刃有余地分配存储空间。但是垃圾收集时的代价是非常高昂的,这也是导致Java性能不佳的因素之一。