二叉树是使用较多的一种树形结构,如比较经典的二叉排序树,Huffman编码等,都使用到了二叉树的结构,同时,在机器学习算法中,基于树的学习算法中也大量使用到二叉树的结构,因此,我们有必要对二叉树的结构有比较详细的了解和掌握。

一、二叉树的基本概念

1、二叉树的概念

二叉树(Binary Tree)是包含n个节点的有限集合,该集合或者为空集(此时,二叉树称为空树),或者由一个根节点和两棵互不相交的、分别称为根节点的左子树和右子树的二叉树组成。

一棵典型的二叉树如下图所示:

数据结构和算法——二叉树_数据结构

由上述的定义可以看出,二叉树中的节点至多包含两棵子树,分别称为左子树和右子树,而左子树和右子树又分别至多包含两棵子树。由上述的定义,二叉树的定义是一种递归的定义。

2、一些常见的二叉树

  • 满二叉树

对于一棵二叉树,如果每一个非叶子节点都存在左右子树,并且二叉树中所有的叶子节点都在同一层中,这样的二叉树称为满二叉树。

一棵满二叉树如下图所示:

数据结构和算法——二叉树_数据结构_02

  • 完全二叉树

对于一棵具有n个节点的二叉树按照层次编号,同时,左右子树按照先左后右编号,如果编号为i的节点与同样深度的满二叉树中编号为i的节点在二叉树中的位置完全相同,则这棵二叉树称为完全二叉树。

一棵完全二叉树如下图所示:

数据结构和算法——二叉树_二叉树_03

3、二叉树的一些性质

对于二叉树,包含一些性质:

  • 在二叉树中,第 i层上至多有2i−1个节点(i≥1)
  • 深度为k的二叉树至多有2k−1个节点(k≥1)
  • 对一棵二叉树,如果叶子节点的个数为n0,度为2的节点个数为n2,则n0=n2+1
  • 具有n个节点的完全二叉树的深度为⌊log2n⌋+1

二、二叉树的基本操作

1、二叉树的存储结构

若要想对二叉树进行操作,首先需要定义二叉树的存储结构,对于如下图所示的二叉树:

数据结构和算法——二叉树_二叉树_04

其对应的存储有两种:

  • 顺序存储结构
  • 链式存储结构

首先,我们来看顺序存储结构,简单来讲,顺序存储结构是指用一维数据存储二叉树中的节点,其中,数组的下标要能体现节点之间的逻辑关系,对于上述的二叉树,其顺序存储结构为:

数据结构和算法——二叉树_子树_05

在顺序存储结构中,“^”表示的是没有节点,从顺序存储可以看出,若出现大量“^”,则对空间是一种极大的浪费。

在二叉树中,每一个节点至多存在左右子树,因此在链式存储结构中,每一个节点的结构为:

数据结构和算法——二叉树_子树_06

其中,data 称为数据域,lchild和rchild称为指针域,分别指向左孩子和右孩子。

在实际使用中,根据不同的需要,使用顺序存储结构和链式存储结构。对于链式存储结构,我们定义如下:

typedef struct BiNode{
        int data;// 数据域的值
        struct BiNode *left;// 左孩子
        struct BiNode *right;// 右孩子
}binode;

2、二叉树的遍历

在二叉树的操作中,二叉树的遍历是基本的操作,对于二叉树的遍历操作,主要分为:

  • 前序遍历
  • 中序遍历
  • 后序遍历
  • 层次遍历

对于前序遍历,首先遍历根节点,其次遍历左孩子,再遍历右孩子,按照如此的顺序遍历整棵树,其代码如下:

// 先序遍历
void pre_order(binode *p){
        if (p != NULL){
                printf("%d\t", p->data);
                pre_order(p->left);
                pre_order(p->right);
        }
}

对于中序遍历,首先遍历左子树,其次遍历父节点,最后遍历右子树,按照如此的顺序遍历整棵树,其代码如下:

// 中序遍历
void in_order(binode *p){
        if (p != NULL){
                in_order(p->left);
                printf("%d\t", p->data);
                in_order(p->right);
        }
}

对于后序遍历,首先遍历左子树,其次遍历右子树,最后遍历父节点,其代码如下:

// 后序遍历
void post_order(binode *p){
        if (p!= NULL){
                post_order(p->left);
                post_order(p->right);
                printf("%d\t", p->data);
        }
}

对于层次遍历,需要使用链表存储每一层的节点,同时,遍历完一个节点,将其左右子节点增加近链表中,其代码为:

// 层次遍历
void lever_order(binode *p){
        // 使用队列
        list<binode *> t;
        if (p != NULL){
                t.push_back(p);
        }

        while (t.size() > 0){
                printf("%d\t", (t.front())->data);
                if ((t.front())->left != NULL){
                        t.push_back((t.front())->left);
                }

                if ((t.front())->right != NULL){
                        t.push_back((t.front())->right);
                }
                t.pop_front();
        }
}

最终的遍历结果为:

数据结构和算法——二叉树_二叉树_07

参考文献

  • 《大话数据结构》
  • 《数据结构》(C语言版)