本文主要结合lucene中RamUsageEstimator类来谈谈Java对象在内存中占用的空间大小。

注意这种计算方式适用于OpenJDK和Oracle JDK两个版本,其它版本可能有所不同。

从整体来看,java对象由对象头、实例数据、对齐填充3个部分组成,其中对齐填充是指对象头的占用空间与实例数据的占用空间如果不是8的整数倍,就需要添加pad填满直到总的占用空间为8的倍数。这里暂时说的8的整数倍,因为在lucene源码中64位的虚拟机是动态获取的(具体原因暂时不清楚,如果像网上和书上说的是固定8的整数倍就没必要动态获取了,尽信书不如无书有些东西没看到源码前最好别下定论),32位是固定的8个字节。对象引用的大小在64位jvm中如果开启指针压缩为4个字节否则8个字节,在32位jvm中只占4个字节。

普通对象的对象头大小为对象引用的大小加上8字节,数组的对象头等于普通对象头的大小加上4个字节的和并且要按照8字节对齐。

字节数组占用的空间=数组的对象头+1*数组个数的和并且按照8字节对齐;

boolean数组的占用空间与字节数组的占用空间相同;

char数组的占用空间=数组的对象头+2*数组个数的和并且按照8字节对齐;

short数组的占用空间与char数组的占用空间相同;

int数组的占用空间=数组的对象头+4*数组个数的和并且按照8字节对齐;

float数组的占用空间与int数组的占用空间相同;

long数组的占用空间=数组的对象头+8*数组个数的和并且按照8字节对齐;

double数组的占用空间与long数组的占用空间相同;

对象数组与以上数组稍有不同,数组中记录的是所有对象的引用地址,因此占用空间=数组的对象头+对象引用的大小*数组个数的和并且按照8字节对齐后再加上每个对象自身占用的实际空间;

现在详细说明每个对象的占用空间,除了对象头,其中的实例数据部分(不包括静态变量)包括基本类型和引用类型(所有的数组和普通对象都是引用类型)。引用类型的指针大小在上面已经说过,指向真正对象的占用空间就是现在讨论的,实际上这就是一个递归,例如:

class Test{
int a;
byte[] b=new byte[10];
}

假设在64位jvm中指针压缩的情况下,Test对象占用的空间=align(对象头(4+8)+数据(4+4))+size(b)。注意:所有的引用类型不与本对象在一个连续的地址空间中,所以字节对齐align时不能包含引用对象的实际大小!

在lucene中为了计算对象实际占用空间就需要实现Accountable接口,就是因为当对象内部存在一个对象引用时就需要计算引用对象实际占用空间!