1:二叉搜索树:所有的非叶子节点至多拥有两个儿子(left和right),所有节点存储一个关键字,非叶子节点的左指针指向小于其关键字的子树,右指针指向大于其关键字的子树;
如图:
使用二叉树需要考虑平衡问题,最好加上平衡算法,使其成为平衡二叉树,这样可以提升效率;
2:红黑树:是一种自平衡的二叉查找树,除了符合二叉搜索树的基本特性外,还具有单独的规则约束:
<1>节点是红色或黑色
<2>根节点是黑色
<3>每个叶子节点都是黑色的空节点(NULL节点)
<4>每个红色节点的两个子节点都是黑色
<5>从任一节点到其每个叶子的所有路径都包含相同数目的黑色节点;
在删除或插入节点的时候,就会打破这些规则,这时候需要作出调整,调整的方法有两种,变色和旋转,其中旋转包括左旋转和右旋转;
变色:将一个或多个节点颜色变成相反色,以使得红黑树符合上述五条规则;
左旋转:
右旋转:
3:B树(又写做B-树,实际上是同一个东西):一种多路搜索树(并不是二叉的);
定义任意非叶子节点最多只能有M个儿子:且M>2;
根节点的儿子数为【2,M】;
自动层次控制;
所有叶子结点位于同一层;
B树的搜索,从根节点开始,对节点内的关键字(有序)序列进行二分查找,如果命中则结束,否则进入查询关键字所属范围的儿子结点;重复,直到所对应的儿子指针为空,或已经是叶子结点;
可以看到,B树中,关键字集合分布在整棵树中,且任何一个关键字出现且只出现在一个节点中,因此搜索可能在非叶子节点结束,其搜索性能等价于在关键字全集内做一次二分查找;B树的性能总是等价于二分查找(与M值无关),也就没有B树平衡问题;
4:B+树:B+树是B树的变体,也是一种多路搜索树,其性能也等价于二分查找;
二者的区别主要在于为所有叶子结点增加了一个链指针,所有关键字都出现在叶子结点的链表中,且链表中的关键字恰好是有序的,不可能在非叶子节点命中,非叶子节点相当于叶子结点的索引,叶子结点相当于存储数据的数据层;(类比数据库,和数据库索引的数据结构相似)
B+树的叶子结点也有指向兄弟的指针,因此B+树只要遍历叶子结点就可以实现整棵树的遍历,支持基于范围的查询,而B树不支持这样的操作;同理可知,B+树支持两种查询方式,一种是从根节点开始查询,一种是从叶子结点开始查询;
5:B*树:是B+树的变体,在B+数的非根和非叶子结点再增加指向兄弟的指针,将节点的最低利用率从1/2提升到2/3;