1、经过测试发现当聚集索引新建或者重建时,会按照逻辑顺序重新排列数据页和数据页内的数据行的物理顺序。

2、但修改表时,无论是聚集索引还是堆的数据页都是按自然顺序向后插入数据,页面上的偏移量可以证明。因为数据库的最小读取单元是页,所以页内的物理顺序无关紧要,只需要维护好页内数据的逻辑顺序。

      聚集表中插入数据时会根据索引找到相应数据页进行自然顺序插入(内部填充因子,使得数据页保留一定的空闲空间),

   如果数据页满,将分页(数据按一定比例挪到新数据页,插入行在挪动完毕后自然顺序插入。新页的物理顺序与逻辑顺序可能不一致)。

3、然后聚集索引的数据页和索引页的逻辑顺序会调整,可以通过dbcc page 的row offset array(slot array)证明。

4、基于以上理论,碎片的产生就合理了。因为是逻辑上的调整,所以当在表中插入数据时,可能或产生物理顺序与逻辑顺序不一致的页面。

5、基于第一点,当表的碎片大时,可以选择重建索引。

6、索引有重建和重组之分。碎片有外部碎片(数据在插入,更新等操作时,索引的逻辑顺序与物理顺序不一致)和内部碎片(由于页面拆分时产生,由填充因子控制)之分。

 ----------------------------------------------------

实验涉及到的命令:

DBCC IND ( { 'dbname' | dbid }, { 'objname' | objid },
      { nonclustered indid | 1 | 0 | -1 | -2 } [, partition_number] )

获取页号,文件号,页数(每一条数据代表一页)

--   1:显示所有分页的信息,包括IAM分页,数据分页,所有存在的LOB分页和行溢出页,索引分页
--  -1: 显示所有IAM、数据分页、及指定对象上全部索引的索引分页.
--  -2: 显示指定对象的所有IAM分页
---  nonclustered indid:显示所有的IAM、数据分页以及一个索引的索引分页信息 

----------------------------------------------------------

属性说明:

46 --{'dbname'|dbid}表示数据库名或者数据库ID
 47 --
 48 --{'objectname'|objectID}表示对象名或者对象ID
 49 --
 50 --{nonclustered indid|1|0|-1|-2}表示显示行内数据分页及指定对象的行内IAM分页信息
 51 --
 52 --  1:显示所有分页的信息,包括IAM分页,数据分页,所有存在的LOB分页和行溢出页,索引分页
 53 --
 54 -- -1: 显示所有IAM、数据分页、及指定对象上全部索引的索引分页.
 55 --
 56 -- -2: 显示指定对象的所有IAM分页
 57 --
 58 -- nonclustered indid:显示所有的IAM、数据分页以及一个索引的索引分页信息。
 59 --
 60 -- {partition_number}->可选,为了与中的DBCC IND命令向前兼容.它指定了一个特定分区号,如果不指定,显示所有分区的信息。
  
 --以下是DBCC IND命令输出结果的字段描述:
字段名称                   字段描述
PageFID                    页面文件的ID
PagePID                     页面编号
IAMFID              管理该页面的IAM页面所在的文件ID
IAMPID               管理该页面的IAM页面编号
ObjectID                    表对象ID
IndexID                索引ID,0 代表堆, 1 代表聚集索引, 2-250 代表非聚集索引 大于250就是text或image字段 书本P18
PartitionNumber        表或索引所在的分区号码
PartitionID                包含该分页的分区ID
iam_chain_type          该页所属分配单元类型;行内数据、行溢出数据或Lob数据
PageType           分页类型:1:数据页面;2:索引页面;3:Lob_mixed_page;4:Lob_tree_page;10:IAM页面
IndexLevel          索引层级,0 代表叶级别分页 ;>0 代表非叶级别层次; NULL 代表IAM分页
NextPageFID            本层下一个分页所在的文件ID
NextPageFID               本层下一个分页ID 
PrevPageFID          本层上一个分页所在的文件ID 
PrevPageFID                本层上一个分页ID



--必须启用此表示才能查看page的详细情况
dbcc traceon(3604)
go

-------------------------------------------------

DBCC PAGE (
['database name'|database id], 
file number, page number, 
print option = [0|1|2|3] )

获取页内行数据的偏移量

第一个参数是数据库名或数据库ID
第二个参数指定文件号
第二个参数指定页号
Print opt参数可选; 可以使用以下值:
0 默认值; 输出buffer header 和 page header信息
1 输出 buffer header, page header, 分别输出每行信息, 行偏移表
2 输出 buffer header, page header, 整页数据,  行偏移表
3 输出 buffer header, page header, 别输出每行信息, 行偏移表; 分别列出每列的值

----------------------------------------------------------------------

page属性说明:

PAGE HEADER部分,即该页面的前96个字节。
141 
142 m_pageId = (1:106)              当前页面号码
143 
144 m_headerVersion = 1            版本号,始终为1
145 
146 m_type = 10                当前页面类型,m_type=1表示数据页面  10:IAM页
147 
148 m_typeFlagBits = 0x0         数据页和索引页为4,其他页为0
149 
150 m_level = 0              该页在索引页(B树)中的级数,0表示为叶子节点
151 
152 m_flagBits = 0x0              页面标志
153 
154 m_objId (AllocUnitId.idObj) = 277576027          对象id 表id
155 
156 m_indexId (AllocUnitId.idInd) = 1      索引ID,0 代表堆, 1 代表聚集索引, 2-250 代表非聚集索引 大于250就是text或image字段 书本P18
157 
158 Metadata: AllocUnitId = 299666199216128      储单元的ID,sys.allocation_units.allocation_unit_id
159 
160 Metadata: PartitionId = 299666199216128     数据页所在的分区号,sys.partitions.partition_id
161 
162 Metadata: IndexId = 1              跟m_indexId一样 对象的索引号,sys.objects.object_id&sys.indexes.index_id
163 
164 Metadata: ObjectId = 277576027      跟m_objId 一样     该页面所属的对象的id,sys.objects.object_id
165 
166 m_prevPage = (0:0)                         该数据页的前一页面
167 
168 m_nextPage = (0:0)                         该数据页的后一页面
169 
170 pminlen = 90          定长数据所占的字节数为90个字节
171 
172 m_slotCnt = 2    页面中的数据的行数,每页2条记录
173 
174 m_freeCnt = 6         页面中剩余的空间,还剩6字节的空间
176 m_freeData = 8182     页面空闲空间的位置在8182这个位置 一个页面8KB约等于8192字节 页面空闲空间的位置在8182 
177                       说明这个页面已经放不下数据了
179 m_reservedCnt = 0           活动事务释放的字节数 

181 m_lsn = (6:524:11)          日志记录号 

184 m_xactReserved = 0       最新加入到m_reservedCnt领域的字节数

187 m_xdesId = (0:0)        添加到m_reservedCnt的最近的事务id

190 m_ghostRecCnt = 0            幻影数据的行数

193 m_tornBits = 1        页的校验位或者被由数据库页面保护形式决定页面保护位取代

 

... 行偏移数组
8176-8177 slot7
672-8175 空余空间  
7 (0x7) - 607 (0x25f) 607-671  
6 (0x6) - 542 (0x21e) 542-606  
5 (0x5) - 467 (0x1d3) 467-541  
4 (0x4) - 388 (0x184) 388-466  
3 (0x3) - 309 (0x135) 309-387  
2 (0x2) - 236 (0xec) 236-308
1 (0x1) - 165 (0xa5) 165-235  
0 (0x0) - 96 (0x60) 96-164
0-95 pageheader
DBCC 执行完毕。如果 DBCC 输出了错误信息,请与系统管理员联系。