树
概念
树是由结点或顶点和边组成的(可能是非线性的)且不存在着任何环的一种数据结构。没有结点的树称为空(null或empty)树。一棵非空的树包括一个根结点,还(很可能)有多个附加结点,所有结点构成一个多级分层结构。
1. 有且仅有一个特定的称为根的节点。
2. 当n>1时,其余节点可分为m(m>0)个互不相交的有限集,每一个集合本身又是一个树,并称为根的子树。
树的标准结构:
在上图中,节点1是根节点(root);节点5、6、7、8是树的末端,没有“孩子”,被称为叶子节点(leaf)。图中的虚线部分,是根节点1的其中一个子树。
示例
或者企业里的职级关系
又比如一本书的目录
常用树
二叉树
概念
二叉树(binary tree)是树的一种特殊形式。二叉,顾名思义,这种树的每个节点最多有2个孩子节点。注意,这里是最多有2个,也可能只有1个,或者没有孩子节点。
二叉树的结构如图所示:
二叉树节点的两个孩子节点,一个被称为左孩子(left child),一个被称为右孩子(right child)。这两个孩子节点的顺序是固定的,就像人的左手就是左手,右手就是右手,不能够颠倒或混淆。
分类
1、满二叉树(完美二叉树)
概念:一个二叉树的所有非叶子节点都存在左右孩子,并且所有叶子节点都在同一层级上,那么这个树就是满二叉树。
图示:
2、完全二叉树
概念:若设二叉树的深度为k,除第 k 层外,其它各层 (1~k-1) 的结点数都达到最大个数,第k 层所有的结点都连续集中在最左边,这就是完全二叉树。
图示:
3、平衡二叉树
概念:它或者是一颗空树,或它的左子树和右子树的深度之差(平衡因子)的绝对值不超过1,且它的左子树和右子树都是一颗平衡二叉树。
图示:
二叉树存储
二叉树在内存中是怎样存储的呢?
数据结构可以划分为物理结构和逻辑结构。二叉树属于逻辑结构,它可以通过多种物理结构来表达。
二叉树可以用哪些物理存储结构来表达呢?
1. 链式存储结构。
2. 数组。
链式存储
一个节点最多可以指向左右两个孩子节点,所以二叉树的每一个节点包含3部分。
- 存储数据的data变量
- 指向左孩子的left指针
- 指向右孩子的right指针
数组存储
使用数组存储时,会按照层级顺序把二叉树的节点放到数组中对应的位置上。如果某一个节点的左孩子或右孩子空缺,则数组的相应位置也空出来。为什么这样设计呢?因为这样可以更方便地在数组中定位二叉树的孩子节点和父节点。假设一个父节点的下标是parent,那么它的左孩子节点下标就是2×parent + 1;右孩子节点下标就是2×parent + 2。反过来,假设一个左孩子节点的下标是leftChild,那么它的父节点下标就是(leftChild-1)/ 2。假如节点4在数组中的下标是3,节点4是节点2的左孩子,节点2的下标可以直接通过计算得出。节点2的下标 = (3-1)/2 = 1显然,对于一个稀疏的二叉树来说,用数组表示法是非常浪费空间的。
二叉树应用
查找
非常适合查找的树-----二叉查找树(Binary Search)
概念:二叉查找树在二叉树的基础上增加了以下几个条件:
- 如果左子树不为空,则左子树上所有节点的值均小于根节点的值
- 如果右子树不为空,则右子树上所有节点的值均大于根节点的值
- 左、右子树也都是二叉查找树
图示:
在原本二叉树的基础上增加这些条件又会带来什么样的效果呢?
例如查找值为4的节点,步骤如下。
1. 访问根节点6,发现4<6。
2. 访问节点6的左孩子节点3,发现4>3。
3. 访问节点3的右孩子节点4,发现4=4,这正是要查找的节点。
对于一个节点分布相对均衡的二叉查找树来说,如果节点总数是n,那么搜索节点的时间复杂度就是O(logn),和树的深度是一样的。
代码示例:
package arithmetic.com.ty.binary;
public class BinarySearchTree {
private Node tree;
public Node find(int data) {
Node p = tree;
while (p != null) {
if (data < p.data)
p = p.left;
else if (data > p.data)
p = p.right;
else
return p;
}
return null;
}
public static class Node {
private int data;
private Node left;
private Node right;
public Node(int data) {
this.data = data;
}
}
}
维持相对顺序
二叉查找树要求左子树小于父节点,右子树大于父节点,正是这样保证了二叉树的有序性。因此二叉查找树还有另一个名字——二叉排序树(binary sort tree)。新插入的节点,同样要遵循二叉排序树的原则。例如插入新元素5,由于5<6,5>3,5>4,所以5最终会插入到节点4的右孩子位置。
再如插入新元素10,由于10>6,10>8,10>9,所以10最终会插入到节点9的右孩子位置。
但是二叉查找树也会存在一个问题,例如:
在二叉查找树中依次插入9、8、7、6、5、4
查询节点的时间复杂度也退化成了O(n)。
1、插入
插入代码示例:
public void insert(int data) {
if (tree == null) {
tree = new Node(data);
return;
}
Node p = tree;
while (p != null) {
if (data > p.data) {
if (p.right == null) {
p.right = new Node(data);
return;
}
p = p.right;
} else { // data < p.data
if (p.left == null) {
p.left = new Node(data);
return;
}
p = p.left;
}
}
}
2、删除
针对要删除节点的子节点个数的不同,我们需要分三种情况来处理。
第一种情况是,如果要删除的节点没有子节点,我们只需要直接将父节点中,指向要删除节点的指针置为 null。比如图中的删除节点 55。
第二种情况是,如果要删除的节点只有一个子节点(只有左子节点或者右子节点),我们只需要更新父节点中,指向要删除节点的指针,让它指向要删除节点的子节点就可以了。比如图中的删除节点 13。
第三种情况是,如果要删除的节点有两个子节点,这就比较复杂了。我们需要找到这个节点的右子树中的最小节点,把它替换到要删除的节点上。然后再删除掉这个最小节点,因为最小节点肯定没有左子节点(如果有左子结点,那就不是最小节点了),所以,我们可以应用上面两条规则来删除这个最小节点。比如图中的删除节点 18。
public void delete(int data) {
//p指向要删除的节点,初始化指向根节点
Node p = tree;
//pp记录的是 p的父节点
Node pp = null;
while (p != null && p.data != data) {
pp = p;
if (data > p.data) {
p = p.right;
}else {
p = p.left;
}
}
if (p == null) {
// 没有找到
return;
}
// 要删除的节点有两个子节点
if (p.left != null && p.right != null) { // 查找右子树中最小节点
Node minP = p.right;
Node minPP = p; // minPP 表示 minP 的父节点
while (minP.left != null) {
minPP = minP;
minP = minP.left;
}
// 将 minP 的数据替换到 p 中
p.data = minP.data;
// 下面就变成了删除 minP 了
p = minP;
pp = minPP;
}
// 删除节点是叶子节点或者仅有一个子节点
Node child; // p 的子节点
if (p.left != null) {
child = p.left;
}else if (p.right != null) {
child = p.right;
}else {
child = null;
}
if (pp == null) {
// 删除的是根节点
tree = child;
}else if (pp.left == p) {
pp.left = child;
}else {
pp.right = child;
}
}
二叉树遍历
遍历方式
从节点之间位置关系的角度来看,二叉树的遍历分为4种。
- 前序遍历-----根结点-->左子树-->右子树
- 中序遍历-----左子树-->根结点-->右子树-----中序遍历二叉查找树,可以输出有序的数据序列,时间复杂度是 O(n),非常高效。
- 后序遍历-----左子树-->右子树-->根结点
- 层序遍历
从更宏观的角度来看,二叉树的遍历归结为两大类。
- 深度优先遍历(前序遍历、中序遍历、后序遍历)
- 广度优先遍历(层序遍历)
深度优先遍历
概念:所谓深度优先,顾名思义,就是偏向于纵深,“一头扎到底”的访问方式。
前序遍历
二叉树的前序遍历,输出顺序是根节点、左子树、右子树。
示例:
1. 首先输出的是根节点1。
2. 由于根节点1存在左孩子,输出左孩子节点2。
3. 由于节点2也存在左孩子,输出左孩子节点4。
4. 节点4既没有左孩子,也没有右孩子,那么回到节点2,输出节点2的右孩子节点5。
5. 节点5既没有左孩子,也没有右孩子,那么回到节点1,输出节点1的右孩子节点3。
6. 节点3没有左孩子,但是有右孩子,因此输出节点3的右孩子节点6。
中序遍历
二叉树的中序遍历,输出顺序是左子树、根节点、右子树。
1. 首先访问根节点的左孩子,如果这个左孩子还拥有左孩子,则继续深入访问下去,一直找到不再有左孩子的节点,并输出该节点。显然,第一个没有左孩子的节点是节点4。
2. 依照中序遍历的次序,接下来输出节点4的父节点2。
3. 再输出节点2的右孩子节点5。
4. 以节点2为根的左子树已经输出完毕,这时再输出整个二叉树的根节点1。
5. 由于节点3没有左孩子,所以直接输出根节点1的右孩子节点3。
6. 最后输出节点3的右孩子节点6。
后序遍历
二叉树的后序遍历,输出顺序是左子树、右子树、根节点。
深度优先遍历代码示例:
package arithmetic.com.ty.binary;
import java.util.Arrays;
import java.util.LinkedList;
public class BinaryTreeTraversal {
public static void main(String[] args) {
LinkedList<Integer> inputList = new LinkedList<Integer>(
Arrays.asList(new Integer[] { 3, 2, 9, null, null, 10, null, null, 8, null, 4 }));
TreeNode treeNode = createBinaryTree(inputList);
System.out.println(" 前序遍历:");
preOrderTraveral(treeNode);
System.out.println(" 中序遍历:");
inOrderTraveral(treeNode);
System.out.println(" 后序遍历:");
postOrderTraveral(treeNode);
}
/**
* 构建二叉树
*
* @param inputList 输入序列
*/
public static TreeNode createBinaryTree(LinkedList<Integer> inputList) {
TreeNode node = null;
if (inputList == null || inputList.isEmpty()) {
return null;
}
Integer data = inputList.removeFirst();
if (data != null) {
node = new TreeNode(data);
/**
* 1、循环LinkedList:{3, 2, 9, null, null, 10, null, null, 8, null, 4}
* 2、如果List中不为null是数据,都会封装成TreeNode,并递归创建leftChild
* 3、当遇到index为3的null时,创建leftChild=createBinaryTree(inputList)的递归返回,此时leftChild为9
* 4、然后开始执行rightChild = createBinaryTree(inputList),但是index为4的数据依然为null,因此9的兄弟节点为null
* 5、然后开始往回执行,此时leftChild为2,开始执行rightChild = createBinaryTree(inputList),因此2的右子树为10
* .
* .
* .
*/
node.leftChild = createBinaryTree(inputList);
node.rightChild = createBinaryTree(inputList);
}
return node;
}
/**
* 二叉树前序遍历
* @param node 二叉树节点
*/
public static void preOrderTraveral(TreeNode node) {
if (node == null) {
return;
}
System.out.println(node.data);
/**
* 1、leftChild也可能有leftChild以及rightChild,因此需要递归下去
*/
preOrderTraveral(node.leftChild);
preOrderTraveral(node.rightChild);
}
/**
* 二叉树中序遍历
* @param node 二叉树节点
*/
public static void inOrderTraveral(TreeNode node) {
if (node == null) {
return;
}
inOrderTraveral(node.leftChild);
System.out.println(node.data);
inOrderTraveral(node.rightChild);
}
/**
* 二叉树后序遍历
* @param node 二叉树节点
*/
public static void postOrderTraveral(TreeNode node) {
if (node == null) {
return;
}
postOrderTraveral(node.leftChild);
postOrderTraveral(node.rightChild);
System.out.println(node.data);
}
/**
* 二叉树节点
*/
private static class TreeNode {
int data;
TreeNode leftChild;
TreeNode rightChild;
TreeNode(int data) {
this.data = data;
}
}
}
广度优先遍历
其基本思想是尽最大程度辐射能够覆盖的节点,并对其进行访问。
上图就是一个二叉树的层序遍历,每个节点左侧的序号代表该节点的输出顺序。可是,二叉树同一层次的节点之间是没有直接关联的,如何实现这种层序遍历呢?这里同样需要借助一个数据结构来辅助工作,这个数据结构就是队列。
1. 根节点1进入队列。
2. 节点1出队,输出节点1,并得到节点1的左孩子节点2、右孩子节点3。让节点2和节点3入队。
3. 节点2出队,输出节点2,并得到节点2的左孩子节点4、右孩子节点5。让节点4和节点5入队。
4. 节点3出队,输出节点3,并得到节点3的右孩子节点6。让节点6入队。
5. 节点4出队,输出节点4,由于节点4没有孩子节点,所以没有新节点入队。
6. 节点5出队,输出节点5,由于节点5同样没有孩子节点,所以没有新节点入队。
7.节点6出队,输出节点6,节点6没有孩子节点,没有新节点入队。
广度优先代码示例:
public static void levelOrderTraversal(TreeNode root) {
Queue<TreeNode> queue = new LinkedList<TreeNode>();
queue.offer(root);
while (!queue.isEmpty()) {
TreeNode node = queue.poll();
System.out.println(node.data);
if (node.leftChild != null) {
queue.offer(node.leftChild);
}
if (node.rightChild != null) {
queue.offer(node.rightChild);
}
}
}