在学习数据结构的时候,老师多少会提到并查集,他的应用也是超级广泛。本文首先会通过案例来对并查集有一个介绍。然后给出并查集的java实现。
一、并查集原理
话说在江湖上有很多门派,这些门派相互争夺武林霸主。毕竟是江湖中人,两个人见面一言不合就开干。但是打归打,总是要判断一下是不是自己人,免得误伤。
于是乎,分了各种各样的门派,比如说张无忌和杨过俩人要打架,就先看看是不是同一门派的,不是的话那就再开干。要是张无忌和杨过觉得俩人合得来,那就合并门派。
而且规定了,每一个门派都有一个掌门人,比如武当派就是张三丰。华山派就是岳不群等等。
现在我们把目光转到并查集上。
(1)张无忌和杨过打架之前,先判断是否是同一门派,这就涉及到了并查集的查找操作。
(2)张无忌和杨过觉得俩人合得来,那就合并门派,这就涉及到了并查集的合并操作。
(3)每一个门派都有一个掌门人,这涉及到了并查集的存储方式。掌门人代表了这个门派的根节点。
现在我们从这个例子的思想开始认识一下并查集。
二、并查集简单实现
并查集主要涉及到两种操作,合并和查找。假设有一个动态集合:S={s1,s2,s3,…..sn}。在这个集合里面每一个元素都是一个江湖人物。比如S1代表了岳不群等等。
我们实现一个并查集的时候首先要考虑的就是存储结构,一般情况下有两种:数组和链表。现在我们使用数组来实现一下。
1、类架构
1public class JiangHuSets {
2 //使用数组存储每一个英雄的上级领导
3 private int[] s;
4 //记录江湖中的英雄数量
5 private int count;
6 public JiangHuSets(int numElements) {
7 //构造函数,负责初始化并查集
8 }
9 public void unionByHeight(int root1, int root2){
10 //union操作
11 }
12 public int find(int x){
13 //find 操作
14 }
15}
在上面的类中,我们只是定义了一个雏形,还没有给出一个具体的实现。下面我们针对并查集的查找和合并操作。给出以下具体的实现。
在这里数组s中存储了每一个江湖人的上级。比如说 s[i] 表示该元素 i 的上级领导。
2、构造函数实现
在前文的例子中,我们规定了每一个门派都有一个掌门人。但是在江湖开始的时候,每个人都是自成一派的,也就是每一个江湖人的上级都是他自己。
1public JiangHuSets(int numElements) {
2 s = new int[numElements];
3 count = numElements;
4 //一开始每个人都是自成一派
5 for(int i = 0; i < s.length; i++)
6 //每一个江湖人的上级都是他自己
7 s[i] = -1;
8}
在这个构造函数里面,首先初始化了一个数组s,然后赋值numElements给count,接下来使用for循环,初始化每一个江湖人的上级都是他自己,在这里使用-1表示。
3、合并操作
Union操作就是将两个不相交的子集合合并成一个大集合。如何去合并呢?其实原理很简单,只需要把一棵子树的根结点指向另一棵子树即可完成合并。也就是指定其中一个人是另外一个人的上级就好了。
1 public void unionByHeight(int root1, int root2) {
2 //将root1作为root2的新树根
3 s[root2] = root1;
4 }
就这一行代码就可以实现合并,但是这个方式虽然简单,但是肯定是存在着很多问题,一会再说。
4、查找操作
Find操作就是查找某个元素所在的集合,返回该集合的代表元素。通俗的理解就是根据张无忌找到其相应门派的掌门人张三丰。
1public int find(int x){
2 //如果说s[x]小于0,也就是为-1,说明当前的x为门派的根
3 if(s[x] < 0)
4 //返回门派的根,也就是掌门人
5 return x;
6 else
7 //否则的话,递归查找即可。
8 return find(s[x]);
9}
到目前为止,我们可算是把并查集的基本实现都给完成了,但是前文中不是提到了嘛,合并的时候其实是有很多问题,而且查找的时候依然也有很多问题。别着急,想要我们的算法更加的高效,就必须要好好地改进一波。
三、并查集改进
1、出现问题
上面介绍的Union操作很随意:任选一棵子树,将另一棵子树的根指向它即完成了合并。也就是随意指定一个人成为另外一个人的上级。合并操作越来越多的时候,可能会出现一个非常不平衡的情况。
这就是不好的现象,而且我们想要查找节点4的根节点,就需要4-->3-->2-->1一直不停的找,这效率真的很恶心。
1、合并操作改进
合并的时候,判断一下root1和root2谁的子节点多,谁多谁做上级领导。就好比是两个人见面合并,谁的人数,谁做大哥。
1 public void unionByHeight(int root1, int root2){
2 //如果root1和root2是同一个门派,那就不用合并了,直接返回
3 if(find(root1) == find(root2))
4 return;
5 //如果root2的人多,那就用root2做大哥
6 if(s[root2] < s[root1])
7 s[root1] = root2;
8 else{
9 //人一样多,谁做大哥都可以,这里使用root1
10 if(s[root1] == s[root2])
11 s[root1]--;
12 s[root2] = root1;
13 }
14 //每次合并,江湖上都会少一个人
15 count--;
16 }
2、查找操作改进
在查找的时候,将这条路上的所有节点,全部让掌门人直接管理。这很明显改变了树的高度。
1public int find(int x){
2 //s[x]为负数时,x就是掌门人
3 if(s[x] < 0)
4 return x;
5 else
6 //使用了路径压缩,让这条路径上的所有人的上级直接变为掌门人
7 return s[x] = find(s[x]);
8 //return find(s[x]); 没有使用 路径压缩
9}
OK,并查集的基本操作就是这样。面试的时候经常会有并查集相关的题目。我总结了一部分。大概十几道题,都是力扣上的。