文章目录
- 主键
- 表结构
- 表空间(tablespace)
- 段(segment)
- 区(extent)
- 页(page)
- 页结构
- File Header(文件头)
- Page Header(页头)
- Infimum和Supremum
- User Records和Free Space
- Page Directory(页目录)
- 行(row)
- Compact行记录(Mysql5.0之后)
《Mysql技术内幕:Innodb存储引擎》
主键
每一个表都必有一个主键,这个主键可能是显式定义的(PRIMARY KEY),若没有显示定义,则将表中定义为非空唯一的索引(UNIQUE NOT NULL)设置为主键,如果这样的索引也没有,则会隐式增加一个6byte的字段并设置为主键。总结来说,表中主键按顺序为
- 显式设置PRIMARY KEY
- 显示设置UNIQUE NOT NULL
- 隐式增加主键
表结构
innodb的数据被放在一个空间(文件)中,这个空间被称为表空间(tablespace),而表空间由段(segment)、区(extent)、页(page)组成。
表空间(tablespace)
默认情况下innodb有一个共享表空间ibdata1
,即所有数据都放在其中。如果启用了参数innodb_file_per_table
,顾名思义,每个表都将有一个单独的表空间,但是,这个单独表空间只存放了数据、索引和插入缓冲,另外的数据、undo信息、系统事务信息等还是放在共享表空间ibdata1中。
段(segment)
如上图所示,表空间由多种类型的段组成,例如数据段、索引段、回滚段等。
innodb存储引擎表的数据是由索引组织的,数据即索引、索引即数据。众所周知,表的底层数据结构是B+树
,数据段为B+数的叶子结点
(leaf node segment),索引段为B+数的非叶子节点
(non-leaf node segment)。
区(extent)
区由64个页组成,一页大小为16KB,每个区大小为1M。
当我们启用了innodb_file_per_table,创建表的默认大小为 96KB。既然区是1M,那么表应该至少1M?其实是因为表空间优先使用32个碎片页,等碎片页用完了才会申请区。
页(page)
B+树索引只能找到记录所在的页,而不能找到具体某条记录
一页大小为16KB,也称作块,页是Innodb磁盘管理的最小单位。
常见的页类型有:
- 数据页(B-tree Node)
- undo页(Undo Log Page)
- 系统页(System Page)
- 事务数据页(Transaction system Page)
- 插入缓冲位图页(Insert Buffer Bitmap)
- 插入缓冲空闲列表页(Insert Buffer Free List)
- 未压缩的二进制大对象页(Uncompressed BLOB Page)
- 压缩的二进制大对象页(Compressed BLOB Page)
页结构
Innodb数据页由七个部分组成:
- File Header(文件头)
- Page Header(页头)
- Infimum(下限) + Supremum(上限) Records
- User Records(用户记录,即行记录)
- Free Space(空闲空间)
- Page Directory(页目录)
- File Trailer(文件结尾信息)
这其中,文件头、页头、文件结尾信息大小固定,其他部分是动态的。
File Header(文件头)
- FIL_PAGE_SPACE_OR_CHKSUM:代表该页的checksum值
- FIL_PAGE_OFFSET:表空间中页的偏移值
- FIL_PAGE_PREV,FIL_PAGE_NEXT:代表上一页、下一页。B+树的结构决定页是由双向链表构成的
- FIL_PAGE_LSN:该页最后被修改的日志序列位置。LSN(Log Sequence Number)
- FIL_PAGE_TYPE:页的类型,即上述数据页、undo页等
- FIL_PAGE_ARCH_LOG_NO_OR_SPACE_ID:代表该页属于哪个表空间(按上述所说,
innodb_file_per_table
不管开没开,共享表空间中总有不同表的数据)
Page Header(页头)
- PAGE_N_DIR_SLOTS:在Page Directory(页目录)中的slot(槽)数
- PAGE_HEAP_TOP:堆中第一条记录的指针
- PAGE_N_HEAP:堆中的记录数
- PAGE_FREE:指向空闲列表的指针
- PAGE_LAST_INSERT:最后插入记录的位置
- PAGE_N_RECS:该页中的记录数
- PAGE_MAX_TRX_ID:修改当前页的最大事务ID
- PAGE_LEVEL:当前页在B-Tree(B+树)的位置
- PAGE_INDEX_ID:当前页属于哪个索引ID
Infimum和Supremum
- Infimum(下限):比页中所有主键都要小
- Supremum(上限):比任何可能的主键都要大
User Records和Free Space
- User Records:即行记录,存储每行的数据,按照B+树索引组织
- Free Space:空闲的空间,同样是链表结构,当一个行记录被删除时,就会加入这个链表
Page Directory(页目录)
页目录中存放的是一些记录的指针,这些记录也被称作slot(槽)
,每个槽内有4~8条数据,上面说了,b+树只能定位到页,而查找页内的记录则是依靠这些slot,比如有(a, b, c, d, e, f, g, h, i, j)这些数据,那么假设槽内有4条记录,则页目录里的指针为(a, e, i),先通过二分查找的方式找到槽,再根据每条记录的前后指针(每条记录都是双向链表的节点)找到结果。
行(row)
Innodb存储引擎是面向行的(row-oriented),也就是说数据是以行的形式存放。
每页能存放的行数也是硬性定义的,最多存放16KB/2~200行,即7992行记录。
Compact行记录(Mysql5.0之后)
前三个字段的意义暂且不谈,只说列数据。
值得注意的是,列数据里面的NULL值不占用任何空间,只有NULL标志位
记录了第几行是NULL值。除了显式定义的列外,每行数据都有两个隐藏列
,事务ID列
和回滚指针列
,若没有定义主键,还会增加6字节的RowID列
用做主键。
举个栗子:
在这个例子中,两个NULL值,不论是varchar还是char,都不占用空间。