B树
B树,又称多路平衡查找树,B树中所有结点的孩子个数的最大值称为B树的阶,通常用m表示。一颗m阶B树或为空树,或为满足如下特征的m叉树。
- 树中每个结点至多有m棵子树,即至多含有m-1个关键字
- 若根结点不是终端结点,则至少有两颗子树
- 除根结点外的所有非叶结点至少有[m/2]棵子树,即至少含有[m/2]-1个关键字
- 所有的叶结点都出现同一层次上,并且不带信息(可以视为外部结点或类似于折半查找判定树的查找失败结点,实际上这些结点不存在,指向这些结点的指针为空)
- 所有非叶结点的结构如下:
B树的高度
B树的插入
新元素一定是插入到最底层“终端节点”,用‘查找’来确定插入位置
B树的删除
B+树
一颗m阶的B+树需满足下列条件:
- 每个分支结点最多有m课子树(孩子结点)
- 非叶根结点至少有两棵子树,其他每个分支结点至少有[m/2]课子树
- 结点的子树个数与关键字个数相等
- 所有叶结点包含全部关键字及指向相应记录的指针,叶结点中将关键字按大小顺序排序,并且相邻叶结点按大小顺序互相链接起来
- 所有分支结点中仅包含它的各个子结点中关键字的最大值及指向其子结点的指针
B+树的查找
顺序查找:
B+树 VS B树
m阶B+树:
- 结点中的n个关键字对应n棵子树
- 在B+树中,叶结点包含全部关键字,非叶结点中出现过的关键字也会出现在叶结点中
- 在B+树中,叶结点包含信息,所有非叶结点仅起索引作用,非叶结点中的每个索引项只含有对应子树的最大关键字和指向该子树的指针。不含有该关键字对应记录的存储地址
m阶B树:
- 结点中的n个关键字对应n+1棵子树
- 在B树中,各结点中包含的关键字是不重复的
- B树的结点中都包含了关键字对应的记录的存储地址