java stream distinct去重对象 java set去重原理

转载

冷月星 2024-06-18 16:38:52

Set<E>是单列集合，里面元素不可重复,元素存取无序,元素无索引的根节点
创建对象:Set<E> 集合名 = new HashSet<E>();

Set集合的除重，是发生在调用add（）方法时。下面，简单的看一下add（）方法的底层代码

在HashSet里的add（）方法源码如下

public boolean add(E e) {
        return map.put(e, PRESENT)==null;
    }

我们可以看到，返回的是 map里put方法返回值跟null的比较。若添加成功，则返回True，失败是Fale。

看一下map里put方法，源码如下：

public V put(K key, V value) {
        if (table == EMPTY_TABLE) {
            inflateTable(threshold);
        }
        if (key == null)
            return putForNullKey(value);
        int hash = hash(key);
        int i = indexFor(hash, table.length);
        for (Entry<K,V> e = table[i]; e != null; e = e.next) {
            Object k;
            if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
                V oldValue = e.value;
                e.value = value;
                e.recordAccess(this);
                return oldValue;
            }
        }

        modCount++;
        addEntry(hash, key, value, i);
        return null;
    }

这里只粗略的讲一下Set集合是如何除重的，所以很多跟返回值无关的代码不给予解释。

整个代码的功能分为

一、非空校验，Set集合只允许一个null。

二、遍历查找相同元素

三、返回null ，add（）方法返回  null == null  即true。

以下将代码分块解释：

public V put(K key, V value) {
第一部分:

if (table == EMPTY_TABLE) {
        inflateTable(threshold);
        }

第二部分:

if (key == null)
      return putForNullKey(value);

key == null 非空校验 -----> key的非空校验
判断传入的参数是否为空

若你传入的元素为空的话 --> return putForNullKey(value); -->结束put方法并把方法的结果返回给调用者(add)
                    putForNullKey(value)-->见名知意 专门为放null值的方法
            第二板块的作用:
                判断你传入的参数是不是null:
                    若不是null,继续下面的判断
                    若是null,把这个null值存到集合中,当是当你第二次传入null值的时候,不允许再添加null
            -->Set集合可以有null值的元素,但是只能有一个!!!

第三部分:

int hash = hash(key);
        int i = indexFor(hash, table.length);

hash(Object k)方法如下

final int hash(Object k) {
            int h = hashSeed;
            if (0 != h && k instanceof String) {
                return sun.misc.Hashing.stringHash32((String) k);
            }

            h ^= k.hashCode();

            // This function ensures that hashCodes that differ only by
            // constant multiples at each bit position have a bounded
            // number of collisions (approximately 8 at default load factor).
            h ^= (h >>> 20) ^ (h >>> 12);
            return h ^ (h >>> 7) ^ (h >>> 4);
    }

我们可以看到,hash(Object k)的返回值跟hashCode()有关.我们在自己定义一个类时,对hashCode()进行了重写,
        hashCode()返回了运算后属性值的地址,通过比较hashCode()的值来判断是否是同一个对象.

第四部分:

for (Entry<K,V> e = table[i]; e != null; e = e.next) {
            Object k;
            if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
                V oldValue = e.value;
                e.value = value;
                e.recordAccess(this);
                return oldValue;
            }
        }

for (Entry<K,V> e = table[i]; e != null; e = e.next)  

这个for循环是在做遍历,遍历老的Set集合,找有没有重复的元素,e接收了老的Set集合

if (e.hash == hash && ((k = e.key) == key || key.equals(k)))
 
 左边:e.hash == hash
        通过比较属性值的地址,判断新传入的Set集合是否跟老Set集合的某个是同一个对象

 右边:((k = e.key) == key || key.equals(k)))
       左边:(k = e.key) == key
        这是将老Set集合中的key的地址值赋给k,然后和新传入的key的地址值比较.
        对于引用数据类型的对象,每次创建对象的地址值是不同的,所以k!=key
        对于集合包装类的对象,拿对象名比较时,会拆箱比较基本数据类型的值,所以存在k == key.
        右边:key.equals(k)
         这里重写了equals方法,比较的是属性值是否相同.

//整理逻辑
        若e.hash == hash,则说明对象的运算后属性地址值相同                
            情况一:集合包装类,判断(k = e.key) == key,若相同,则执行if的语句,
返回跟新传入Set相同的老Set集合,即return oldValue
            情况二:引用数据类型,判断key.equals(k)),若相同,则属性值相同,执行if的语句,
返回跟新传入Set相同的老Set集合,即return oldValue
      
        若e.hash != hash,则说明对象的运算后属性地址值不相同,不执行if的语句   一定不是相同的对象

Integer类型的hashCode怎么说?
查看Integer源码可知，Integer的hashCode方法return 是value，也就是Integer的值。

   第五部分:

modCount++;
 addEntry(hash, key, value, i);
 return null;

//新传入的Set集合,非空且与老集合没有相同的元素,则返回null.
}

   也就是说，创建泛型是自己定义对象的Set集合时，要重写hashCode和equals （Set集合的去重依赖重写这两个方法）

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：支付宝绑定账号用户认证 java 支付宝登录认证

下一篇：python 数据库列 python数据库类

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯