建议三篇一起看:
- MySQL索引的实现——行结构(InnoDB引擎) MySQL索引的实现——数据页结构(InnoDB引擎) 链接:
- MySQL索引的实现——B+树构造(InnoDB引擎) MySQL索引的实现——B+树的构造(InnoDB引擎
众所周知,MySQL索引是快速查询数据的方法,今天就从底层介绍MySQL索引的实现。
首先介绍InnoDB引擎的行结构。到目前,InnoDB引擎一共有四种不同类型的行格式,分别是COMPACT、REDUNDANT、DYNAMIC、COMPRESSED。这些行格式在原理上大致相同,这里主要介绍COMPACT行格式。
COMPACT行格式示意图如下:
1.记录的额外信息
1.变长字段长度列表
首先,MySQL支持一些变长的数据结构(比如CARCHAR(20)、各种TEXT类型等),由于变长字段存储数据的字节数不确定,所以在存储真实数据时也要把这些数据占有的字节数也存储起来。
在COMPACT行格式中,所有变长字段的真实数据存放在记录的开头位置,形成一个变长字段长度列表,并且按列的顺序逆序存放。
2.NULL值列表
我们知道,一条记录的某些列可能存储NULL值,且将这些列存放到真实数据中非常占用内存,所以COMPACT行格式将这一条记录的NULL值统一管理起来,存储到NULL值列表中。
3.记录头信息
记录头信息由固定5字节组成,用于描述记录的一些属性,5字节也就是40个二进制位,不同位表示不同的意思。如下表:
名称 | 占用的位 | 作用描述 |
预留位1 | 1 | 未使用 |
预留位2 | 1 | 未使用 |
delect_flag | 1 | 标记该记录是否删除 |
min_rec_flag | 1 | B+树每层非叶子节点最小的目录项记录都会添加该标记 |
o_wened | 4 | 一个页面中的记录会被分成若干个组,每个组中有一个记录是“大哥”,其余的记录都是“小弟”。“大哥”记录的n owned值代表该 组中所有的记录条数,“小弟” 记录的n _owned 值都为0 |
heap_no | 13 | 表示当前记录在页面堆中相对位置 |
record_type | 3 | 表示当前记录的类型,0表示普通记录,1 表示B+树非叶子节点的目录项记录,2表示Infimum记录,3表示Supremum记录 |
next_record | 16 | 记录下一条数据相对位置 |
2.记录的真实数据
对于MySQL中的表来说,真实的数据除了自己定义的列外,MySQL会为每个记录默认添加一些列(也叫隐藏列)具体如下:
列名 | 是否必需 | 占用空间 | 描述 |
row_id | 否 | 6字节 | 行ID,唯一标识一条事务 |
trx_id | 是 | 6字节 | 事务ID |
roll_pointer | 是 | 7字节 | 回滚指针 |
关于是否使用row_id,这里需要说一下InnoDB主键生成策略:优先使用用户自定义的主键作为主键;如果没有定义主键,则选取一个不允许存储NULL值的UNIQUE键作为主键;如果表中连不为NULL值的UNIQUE键都没有定义,则InnoDB会为表默认添加一个名为row_id的隐藏列作为组件。
行格式算是粗略地讲完了,下次就该讲页了。