树和二叉树
1.树的定义和基本术语
1.1树的定义
树(Tree)是n(n≥0)个结点的有限集,它或为空树(n=0);或为非空树,对于非空树T:(1)有且仅有一个称之为根的结点;(2)除根结点以外的其余结点可分为m(m>0)个互不相交的有限集T1, T2, …,$T_m$,其中每一个集合本身又是一棵树,并且称为根的子树(SubTree)。
1.2树的基本术语
(1)**结点**:树中的一个独立单元。包含一个数据元素及若干指向其子树的分支,如图中的A、B、C、D等。
(2)**结点的度**:结点拥有的子树个数称为结点的度。例如,A的度为3,C的度为1,F的度为0。
(3)**树的度**:树的度是树内各结点度的最大值。图所示的树的度为3。
(4)**叶子**:度为0的结点称为叶子或终端结点。结点K、L、F、G、M、I、J都是树的叶子。
(5)**非终端结点**:度不为0的结点称为非终端结点或分支结点。除根结点之外,非终端结点也称为内部结点。
(6)**双亲和孩子**:结点的子树的根称为该结点的孩子,相应地,该结点称为孩子的双亲。例如,B的双亲为A,B的孩子有E和F。
(7)**兄弟**:同一个双亲的孩子之间互称兄弟。例如,H、I和J互为兄弟。
(8)**祖先**:从根到该结点所经分支上的所有结点。例如,M的祖先为A、D和H。
(9)**子孙**:以某结点为根的子树中的任一结点都称为该结点的子孙。如B的子孙为E、K、L和F。
(10)**层次**:结点的层次从根开始定义起,根为第一层,根的孩子为第二层。树中任一结点的层次等于其双亲结点的层次加1。
(11)**堂兄弟**:双亲在同一层的结点互为堂兄弟。例如,结点G与E、F、H、I、J互为堂兄弟。
(12)**树的深度**:树中结点的最大层次称为树的深度或高度。图所示的树的深度为4。
(13)**有序树和无序树**:如果将树中结点的各子树看成从左至右是有次序的(即不能互换),则称该树为有序树,否则称为无序树。在有序树中最左边的子树的根称为第一个孩子,最右边的称为最后一个孩子。
(14)**森林**:是m(m≥0)棵互不相交的树的集合。对树中每个结点而言,其子树的集合即为森林。由此,也可以用森林和树相互递归的定义来描述树。
1.3树的性质
(1)树中的节点数等于所有结点的度数加1
(2)度为m的树中第i层上至多有$m^{i-1}$个节点
(3)高度为h的m叉树至多有$\frac{m^h-1}{m-1}$个结点
(4)具有n结点的m树的最小高度为$\vert \log_m^{n*(m-1)+1}\vert$
(5)具有n个结点的树的总边数为n-1条
**常用的三个等式**:
设总边数为L,总节点数为N,$n_i$表示度为i的结点的个数。
等式一:L = N - 1
等式二:L = $0*n_0+1*n_1+2*n_2+...+i*n_i$
等式三:N = $n_0+n_1+n_2+...+n_i$
2.二叉树的定义
二叉树(Binary Tree)是n(n≥0)个结点所构成的集合,它或为空树(n=0);或为非空树,对于非空树T:
(1)有且仅有一个称之为根的结点;
(2)除根结点以外的其余结点分为两个互不相交的子集T1和T2,分别称为T的左子树和右子树,且T1和T2本身又都是二叉树。
二叉树与树一样具有递归性质,二叉树与树的区别主要有以下两点:
(1)二叉树每个结点至多只有两棵子树(即二叉树中不存在度大于2的结点);
(2)二叉树的子树有左右之分,其次序不能任意颠倒。
3.二叉树的性质
二叉树具有下列重要特性:
性质1 在二叉树的第i层上至多有2i−1个结点(i≥1)。
性质2 深度为k的二叉树至多有2k−1个结点(k≥1)。
性质3 对任何一棵二叉树T,如果其终端结点数为n0,度为2的结点数为n2,则n0=n2+1。
性质4 具有n个结点的完全二叉树的深度为$\lfloor\log_2^{n}\rfloor+1$。($\lfloor\rfloor$表示向下取整)
性质5 如果对一棵有n个结点的完全二叉树(其深度为$\lfloor\log_2^{n}\rfloor+1$)的结点按层序编号(从第1层到第$\log_2^{n}+1$层,每层从左到右),则对任一结点i(1≤i≤n),有:
(1)如果i=1,则结点i是二叉树的根,无双亲;如果i>1,则其双亲PARENT(i)是结点i/2。
(2)如果2i>n,则结点i无左孩子(结点i为叶子结点);否则其左孩子LCHILD(i)是结点2i。
(3)如果2i+1>n,则结点i无右孩子;否则其右孩子RCHILD(i)是结点2i+1。
**常用的三个等式**:
设总边数为L,总节点数为N,$n_i$表示度为i的结点的个数。
等式一:L = N - 1
等式二:L = $0*n_0+1*n_1+2*n_2$
等式三:N = $n_0+n_1+n_2$
**具有N个节点的二叉树有$\frac{(2N)!}{(N+1)!N!}$种形态。**
4.满二叉树
深度为k且含有2k−1个结点的二叉树,且每一层上的结点数都是最大结点数,即每一层i的结点数都具有最大值$2^{i−1}$。
5.完全二叉树
深度为k的,有n个结点的二叉树,当且仅当其每一个结点都与深度为k的满二叉树中编号从1至n的结点一一对应时,称之为完全二叉树。
完全二叉树的特点是:
(1)叶子结点只可能在层次最大的两层上出现;
(2)对任一结点,若其右分支下的子孙的最大层次为l,则其左分支下的子孙的最大层次必为l或l+1
6.二叉树的存储结构
6.1 顺序存储结构
顺序存储结构使用一组地址连续的存储单元来存储数据元素。利用二叉树的性质5来匹配位置索引和值。例如,1号索引为根节点,则其左孩子节点索引为2,右孩子节点索引为3,以此类推。
顺序存储结构适合存储完全二叉树,因为每一个空间元素都被利用起来了。
6.2 链式存储结构
如图所示:
7.遍历二叉树
三种遍历方式,根左右,左根右,左右根。
8.线索二叉树
如图所示:
二叉树的线索化,分为三类,先序线索二叉树,中序线索二叉树,后续线索二叉树。即为分别按照相应的遍历方式得到的线索二叉树。
9.树的存储结构
9.1双亲表示法
9.1孩子表示法
9.1孩子兄弟表示法
10.树与二叉树的转换
树转二叉树:将兄弟结点相连,保留最左侧第一个子节点与根节点相连,其他子节点与根节点断开。重复每一个子树以上行为。最后变形即可。
11.森林与二叉树的转换
森林转二叉树:将森林中的每个树转化为二叉树,再将转化的二叉树以此放在二叉树的右子树上。
二叉树转森林:过程与森林转二叉树相反。
12.树和森林的遍历
12.1 树的遍历
由树结构的定义可引出两种次序遍历树的方法:一种是先根(次序)遍历树,即:先访问树的根结点,然后依次先根遍历根的每棵子树;
另一种是后根(次序)遍历,即先依次后根遍历每棵子树,然后访问根结点。
12.2 森林的遍历
按照森林和树相互递归的定义,可以推出森林的两种遍历方法:先序遍历和中序遍历。
(1)先序遍历森林若森林非空,则可按下述规则遍历:① 访问森林中第一棵树的根结点;② 先序遍历第一棵树的根结点的子树森林;③ 先序遍历除去第一棵树之后剩余的树构成的森林。
(2)中序遍历森林若森林非空,则可按下述规则遍历:① 中序遍历森林中第一棵树的根结点的子树森林;② 访问第一棵树的根结点;③ 中序遍历除去第一棵树之后剩余的树构成的森林。
12.3 与遍历二叉树的关系
13.最优二叉树(赫夫曼树)
哈夫曼(Huffman)树又称最优树,是一类带权路径长度最短的树。
**定义**:假设有m个权值{w1, w2,…, wm},可以构造一棵含n个叶子结点的二叉树,每个叶子结点的权为wi,则其中带权路径长度WPL最小的二叉树称做最优二叉树或哈夫曼树。
**路径**:从树中一个结点到另一个结点之间的分支构成这两个结点之间的路径。
**路径长度**:路径上的分支数目称作路径长度。
**树的路径长度**:从树根到每一结点的路径长度之和。
**权**:赋予某个实体的一个量,是对实体的某个或某些属性的数值化描述。在数据结构中,实体有结点(元素)和边(关系)两大类,所以对应有结点权和边权。结点权或边权具体代表什么意义,由具体情况决定。如果在一棵树中的结点上带有权值,则对应的就有带权树等概念。
**结点的带权路径长度**:从该结点到树根之间的路径长度与结点上权的乘积。
**树的带权路径长度**:树中所有叶子结点的带权路径长度之和。
**性质**:
(1)一棵有n个叶子结点的哈夫曼树共有2n-1个结点。