第一步:计算整个Block Header的大小
数据块头部所需要的空间大小由以下公式计算:
Space after headers (hsize) = DB_BLOCK_SIZE - KCBH - UB4 - KTBBH - ((INITRANS - 1) * KTBIT) - KDBH
其中的一些参数说明如下:
DB_BLOCK_SIZE:数据库的block大小,可以查询V$PARAMETER视图中获得。
KCBH、UB4、KTBBH、KTBIT、KDBH都是常量,这些定义的大小可以从V$TYPE_SIZE视图中获得。
INITRANS是分配给表的初始化事务的数量,可以从USER_TABLES表中的INI_TRANS字段中获得。
第二步:计算每个数据块可用的数据空间
每个数据块为数据保留的空间是由PCTFREE参数所指定的,因此计算公式如下:
Available data space (availspace) = CEIL(hsize * (1 - PCTFREE/100))
– KDBT
其中的一些参数说明如下:
CEIL是取大于或者等于N的最小整数。
PCTFREE是在表中预留出来用于UPDATE操作的空间,可以从USER_TABLES表中的PCT_FREE字段中获得。
KDBT是常量,定义的大小可以从V$TYPE_SIZE视图中获得。如果你找不到KDBT的定义大小,用UB4定义的大小代替也可以。
第三步:计算每行所用的空间大小
计算每行所使用的空间大小是需要多步计算完成的。
首先计算列的大小,包括字节的长度:
Column size including byte length = column size + (1, if column size < 250, else 3)
对于列的大小,既可以利用经验来判断其大小,也可以使用语句来计算每列的大小:
Select avg(vsize(colname)) from table_name;
接着,计算行的大小:
Rowsize = row header (3 * UB1) + sum of column sizes including length bytes
最后,计算每行所用的空间大小:
Space used per row (rowspace) = MAX(UB1 * 3 + UB4 + SB2, rowsize) + SB2
UB1、UB4、SB2都是常量,定义的大小可以从V$TYPE_SIZE视图中获得。
当每行所占用的空间超过了一个数据块可用的空间的大小,但是仍然小于每个数据块保留给UPDATE操作的空间大小(例如,PCTFREE=0),每行记录将仍然被存储在它们自己的block块中。
当每行的空间大小超过了每个数据块可用的空间,并且没有任何保留给UPDATE操作的空间可用了,此时,这行记录将被链接到另外一个block或者更多,因此,这个时候的存储的负载会比较高。
第四步:计算在一个block中可以容纳最多的记录数量
可以使用下面的公式来计算一个数据block中可以容纳的记录的数量:
Number of rows in block = FLOOR(availspace / rowspace)
FLOOR是取小于N的最大整数。
这个过程只是提供一个大致的估算一个表的大小,而不是精确的去计算的。在大致的估算出一个表的大小之后,我们可以利用这个信息来判定在创建表的时候究竟使用多大的INITIAL这个存储参数。当表被创建后开始使用了,空间的需求往往是大于我们通过计算得出的估计值。