在学习数据结构的时候,老师多少会提到并查集,他的应用也是超级广泛。本文首先会通过案例来对并查集有一个介绍。然后给出并查集的java实现。

一、并查集原理

话说在江湖上有很多门派,这些门派相互争夺武林霸主。毕竟是江湖中人,两个人见面一言不合就开干。但是打归打,总是要判断一下是不是自己人,免得误伤。

一个非常实用而且精妙的算法-并查集_java

于是乎,分了各种各样的门派,比如说张无忌和杨过俩人要打架,就先看看是不是同一门派的,不是的话那就再开干。要是张无忌和杨过觉得俩人合得来,那就合并门派。

而且规定了,每一个门派都有一个掌门人,比如武当派就是张三丰。华山派就是岳不群等等。

现在我们把目光转到并查集上。

(1)张无忌和杨过打架之前,先判断是否是同一门派,这就涉及到了并查集的查找操作。

(2)张无忌和杨过觉得俩人合得来,那就合并门派,这就涉及到了并查集的合并操作。

(3)每一个门派都有一个掌门人,这涉及到了并查集的存储方式。掌门人代表了这个门派的根节点。

现在我们从这个例子的思想开始认识一下并查集。

二、并查集简单实现

并查集主要涉及到两种操作,合并和查找。假设有一个动态集合:S={s1,s2,s3,…..sn}。在这个集合里面每一个元素都是一个江湖人物。比如S1代表了岳不群等等。

我们实现一个并查集的时候首先要考虑的就是存储结构,一般情况下有两种:数组和链表。现在我们使用数组来实现一下。

1、类架构

 1public class JiangHuSets {
2    //使用数组存储每一个英雄的上级领导
3    private int[] s;
4    //记录江湖中的英雄数量
5    private int count;
6       public JiangHuSets(int numElements) {
7               //构造函数,负责初始化并查集
8       }
9        public void unionByHeight(int root1, int root2){    
10            //union操作
11       }
12       public int find(int x){
13            //find 操作
14      }
15}

在上面的类中,我们只是定义了一个雏形,还没有给出一个具体的实现。下面我们针对并查集的查找和合并操作。给出以下具体的实现。

在这里数组s中存储了每一个江湖人的上级。比如说 s[i] 表示该元素 i 的上级领导。

2、构造函数实现

在前文的例子中,我们规定了每一个门派都有一个掌门人。但是在江湖开始的时候,每个人都是自成一派的,也就是每一个江湖人的上级都是他自己。

1public JiangHuSets(int numElements) {
2        s = new int[numElements];
3        count = numElements;
4        //一开始每个人都是自成一派
5        for(int i = 0; i < s.length; i++)
6            //每一个江湖人的上级都是他自己
7            s[i] = -1;
8}

在这个构造函数里面,首先初始化了一个数组s,然后赋值numElements给count,接下来使用for循环,初始化每一个江湖人的上级都是他自己,在这里使用-1表示。

3、合并操作

Union操作就是将两个不相交的子集合合并成一个大集合。如何去合并呢?其实原理很简单,只需要把一棵子树的根结点指向另一棵子树即可完成合并。也就是指定其中一个人是另外一个人的上级就好了。

1    public void unionByHeight(int root1, int root2) {
2        //将root1作为root2的新树根
3        s[root2] = root1;
4    }

就这一行代码就可以实现合并,但是这个方式虽然简单,但是肯定是存在着很多问题,一会再说。

4、查找操作

Find操作就是查找某个元素所在的集合,返回该集合的代表元素。通俗的理解就是根据张无忌找到其相应门派的掌门人张三丰。

1public int find(int x){
2        //如果说s[x]小于0,也就是为-1,说明当前的x为门派的根
3        if(s[x] < 0)
4            //返回门派的根,也就是掌门人
5            return x;
6        else
7            //否则的话,递归查找即可。
8            return find(s[x]);
9}

到目前为止,我们可算是把并查集的基本实现都给完成了,但是前文中不是提到了嘛,合并的时候其实是有很多问题,而且查找的时候依然也有很多问题。别着急,想要我们的算法更加的高效,就必须要好好地改进一波。

三、并查集改进

1、出现问题

上面介绍的Union操作很随意:任选一棵子树,将另一棵子树的根指向它即完成了合并。也就是随意指定一个人成为另外一个人的上级。合并操作越来越多的时候,可能会出现一个非常不平衡的情况。

一个非常实用而且精妙的算法-并查集_java_02

这就是不好的现象,而且我们想要查找节点4的根节点,就需要4-->3-->2-->1一直不停的找,这效率真的很恶心。

1、合并操作改进

合并的时候,判断一下root1和root2谁的子节点多,谁多谁做上级领导。就好比是两个人见面合并,谁的人数,谁做大哥。

 1    public void unionByHeight(int root1, int root2){
2        //如果root1和root2是同一个门派,那就不用合并了,直接返回
3        if(find(root1) == find(root2))
4            return;
5        //如果root2的人多,那就用root2做大哥
6        if(s[root2] < s[root1])
7            s[root1] = root2;
8        else{
9            //人一样多,谁做大哥都可以,这里使用root1
10            if(s[root1] == s[root2])
11                s[root1]--;
12            s[root2] = root1;
13        }
14        //每次合并,江湖上都会少一个人
15        count--;
16    }

2、查找操作改进

在查找的时候,将这条路上的所有节点,全部让掌门人直接管理。这很明显改变了树的高度。

1public int find(int x){
2        //s[x]为负数时,x就是掌门人
3        if(s[x] < 0)
4            return x;
5        else 
6            //使用了路径压缩,让这条路径上的所有人的上级直接变为掌门人
7            return s[x] = find(s[x]);
8            //return find(s[x]); 没有使用 路径压缩
9}

OK,并查集的基本操作就是这样。面试的时候经常会有并查集相关的题目。我总结了一部分。大概十几道题,都是力扣上的。