一个非常实用而且精妙的算法-并查集

原创

mb5ffd6fed5661e 2021-01-15 19:25:33 ©著作权

文章标签 java 文章分类 数据结构与算法人工智能

©著作权归作者所有：来自51CTO博客作者mb5ffd6fed5661e的原创作品，请联系作者获取转载授权，否则将追究法律责任

在学习数据结构的时候，老师多少会提到并查集，他的应用也是超级广泛。本文首先会通过案例来对并查集有一个介绍。然后给出并查集的java实现。

一、并查集原理

话说在江湖上有很多门派，这些门派相互争夺武林霸主。毕竟是江湖中人，两个人见面一言不合就开干。但是打归打，总是要判断一下是不是自己人，免得误伤。

一个非常实用而且精妙的算法-并查集_java

于是乎，分了各种各样的门派，比如说张无忌和杨过俩人要打架，就先看看是不是同一门派的，不是的话那就再开干。要是张无忌和杨过觉得俩人合得来，那就合并门派。

而且规定了，每一个门派都有一个掌门人，比如武当派就是张三丰。华山派就是岳不群等等。

现在我们把目光转到并查集上。

（1）张无忌和杨过打架之前，先判断是否是同一门派，这就涉及到了并查集的查找操作。

（2）张无忌和杨过觉得俩人合得来，那就合并门派，这就涉及到了并查集的合并操作。

（3）每一个门派都有一个掌门人，这涉及到了并查集的存储方式。掌门人代表了这个门派的根节点。

现在我们从这个例子的思想开始认识一下并查集。

二、并查集简单实现

并查集主要涉及到两种操作，合并和查找。假设有一个动态集合：S={s1，s2，s3，…..sn}。在这个集合里面每一个元素都是一个江湖人物。比如S1代表了岳不群等等。

我们实现一个并查集的时候首先要考虑的就是存储结构，一般情况下有两种：数组和链表。现在我们使用数组来实现一下。

1、类架构

 1public class JiangHuSets {
 2    //使用数组存储每一个英雄的上级领导
 3    private int[] s;
 4    //记录江湖中的英雄数量
 5    private int count;
 6       public JiangHuSets(int numElements) {
 7               //构造函数，负责初始化并查集
 8       }
 9        public void unionByHeight(int root1, int root2){    
10            //union操作
11       }
12       public int find(int x){
13            //find 操作
14      }
15}

在上面的类中，我们只是定义了一个雏形，还没有给出一个具体的实现。下面我们针对并查集的查找和合并操作。给出以下具体的实现。

在这里数组s中存储了每一个江湖人的上级。比如说 s[i] 表示该元素 i 的上级领导。

2、构造函数实现

在前文的例子中，我们规定了每一个门派都有一个掌门人。但是在江湖开始的时候，每个人都是自成一派的，也就是每一个江湖人的上级都是他自己。

1public JiangHuSets(int numElements) {
2        s = new int[numElements];
3        count = numElements;
4        //一开始每个人都是自成一派
5        for(int i = 0; i < s.length; i++)
6            //每一个江湖人的上级都是他自己
7            s[i] = -1;
8}

在这个构造函数里面，首先初始化了一个数组s，然后赋值numElements给count，接下来使用for循环，初始化每一个江湖人的上级都是他自己，在这里使用-1表示。

3、合并操作

Union操作就是将两个不相交的子集合合并成一个大集合。如何去合并呢？其实原理很简单，只需要把一棵子树的根结点指向另一棵子树即可完成合并。也就是指定其中一个人是另外一个人的上级就好了。

1    public void unionByHeight(int root1, int root2) {
2        //将root1作为root2的新树根
3        s[root2] = root1;
4    }

就这一行代码就可以实现合并，但是这个方式虽然简单，但是肯定是存在着很多问题，一会再说。

4、查找操作

Find操作就是查找某个元素所在的集合，返回该集合的代表元素。通俗的理解就是根据张无忌找到其相应门派的掌门人张三丰。

1public int find(int x){
2        //如果说s[x]小于0，也就是为-1，说明当前的x为门派的根
3        if(s[x] < 0)
4            //返回门派的根，也就是掌门人
5            return x;
6        else
7            //否则的话，递归查找即可。
8            return find(s[x]);
9}

到目前为止，我们可算是把并查集的基本实现都给完成了，但是前文中不是提到了嘛，合并的时候其实是有很多问题，而且查找的时候依然也有很多问题。别着急，想要我们的算法更加的高效，就必须要好好地改进一波。

三、并查集改进

1、出现问题

上面介绍的Union操作很随意：任选一棵子树，将另一棵子树的根指向它即完成了合并。也就是随意指定一个人成为另外一个人的上级。合并操作越来越多的时候，可能会出现一个非常不平衡的情况。

一个非常实用而且精妙的算法-并查集_java_02

这就是不好的现象，而且我们想要查找节点4的根节点，就需要4-->3-->2-->1一直不停的找，这效率真的很恶心。

1、合并操作改进

合并的时候，判断一下root1和root2谁的子节点多，谁多谁做上级领导。就好比是两个人见面合并，谁的人数，谁做大哥。

 1    public void unionByHeight(int root1, int root2){
 2        //如果root1和root2是同一个门派，那就不用合并了，直接返回
 3        if(find(root1) == find(root2))
 4            return;
 5        //如果root2的人多，那就用root2做大哥
 6        if(s[root2] < s[root1])
 7            s[root1] = root2;
 8        else{
 9            //人一样多，谁做大哥都可以，这里使用root1
10            if(s[root1] == s[root2])
11                s[root1]--;
12            s[root2] = root1;
13        }
14        //每次合并，江湖上都会少一个人
15        count--;
16    }

2、查找操作改进

在查找的时候，将这条路上的所有节点，全部让掌门人直接管理。这很明显改变了树的高度。

1public int find(int x){
2        //s[x]为负数时,x就是掌门人
3        if(s[x] < 0)
4            return x;
5        else 
6            //使用了路径压缩,让这条路径上的所有人的上级直接变为掌门人
7            return s[x] = find(s[x]);
8            //return find(s[x]); 没有使用 路径压缩
9}