java hash map扩容机制 hashmap扩容代码

转载

mob64ca14095513 2024-04-15 18:48:42

文章标签 java hash map扩容机制 java 红黑树链表数组 文章分类 Java 后端开发

扩容resize方法

HashMap底层哈希桶的数据结构是数组，所以也会涉及到扩容的问题。

当HashMap的容量达到threshold域值时，就会触发扩容。扩容前后，哈希桶的长度一定会是2的次方。那么到底是怎么扩容的呢？又有哪些精妙的设计呢？一起来看看源码吧

final Node<K,V>[] resize() {
        //oldTab 为当前表的哈希桶
        Node<K,V>[] oldTab = table;
        //当前哈希桶的容量 length
        int oldCap = (oldTab == null) ? 0 : oldTab.length;
        //当前的阈值
        int oldThr = threshold;
        //初始化新的容量和阈值为0
        int newCap, newThr = 0;
        //如果当前容量大于0
        if (oldCap > 0) {
            //如果当前容量已经到达上限
            if (oldCap >= MAXIMUM_CAPACITY) {
                //则设置阈值是2的31次方-1
                threshold = Integer.MAX_VALUE;
                //同时返回当前的哈希桶，不再扩容
                return oldTab;
            }//否则新的容量为旧的容量的两倍。 
            else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                     oldCap >= DEFAULT_INITIAL_CAPACITY)//如果旧的容量大于等于默认初始容量16
                //那么新的阈值也等于旧的阈值的两倍
                newThr = oldThr << 1; // double threshold
        }//如果当前表是空的，但是有阈值。代表是初始化时指定了容量、阈值的情况
        else if (oldThr > 0) // initial capacity was placed in threshold
            newCap = oldThr;//那么新表的容量就等于旧的阈值
        else {//如果当前表是空的，而且也没有阈值。代表是初始化时没有任何容量/阈值参数的情况               // zero initial threshold signifies using defaults
            newCap = DEFAULT_INITIAL_CAPACITY;//此时新表的容量为默认的容量 16
            newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);//新的阈值为默认容量16 * 默认加载因子0.75f = 12
        }
        if (newThr == 0) {//如果新的阈值是0，对应的是  当前表是空的，但是有阈值的情况
            float ft = (float)newCap * loadFactor;//根据新表容量 和 加载因子 求出新的阈值
            //进行越界修复
            newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                      (int)ft : Integer.MAX_VALUE);
        }
        //更新阈值 
        threshold = newThr;
        @SuppressWarnings({"rawtypes","unchecked"})
        //根据新的容量 构建新的哈希桶
            Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
        //更新哈希桶引用
        table = newTab;
        //如果以前的哈希桶中有元素
        //下面开始将当前哈希桶中的所有节点转移到新的哈希桶中
        if (oldTab != null) {
            //遍历老的哈希桶
            for (int j = 0; j < oldCap; ++j) {
                //取出当前的节点 e
                Node<K,V> e;
                //如果当前桶中有元素,则将链表赋值给e
                if ((e = oldTab[j]) != null) {
                    //将原哈希桶置空以便GC
                    oldTab[j] = null;
                    //如果当前链表中就一个元素，（没有发生哈希碰撞）
                    if (e.next == null)
                        //直接将这个元素放置在新的哈希桶里。
                        //注意这里取下标 是用 哈希值 与 桶的长度-1 。 由于桶的长度是2的n次方，这么做其实是等于 一个模运算。但是效率更高
                        newTab[e.hash & (newCap - 1)] = e;
                        //如果发生过哈希碰撞 ,而且是节点数超过8个，转化成了红黑树。下面介绍红黑数的
                    else if (e instanceof TreeNode)
                        ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
                    //如果发生过哈希碰撞，节点数小于8个。则要根据链表上每个节点的哈希值，依次放入新哈希桶对应下标位置。
                    else { // preserve order
                        //因为扩容是容量翻倍，所以原链表上的每个节点，现在可能存放在原来的下标，即low位， 或者扩容后的下标，即high位。 high位=  low位+原哈希桶容量 解释一下，假设说原来的容量是16，扩容后为32，则0-15 位low位，16-31为high位
                        //低位链表的头结点、尾节点
                        Node<K,V> loHead = null, loTail = null;
                        //高位链表的头节点、尾节点
                        Node<K,V> hiHead = null, hiTail = null;
                        Node<K,V> next;//临时节点 存放e的下一个节点
                        do {
                            next = e.next;
                            // 这里又是一个利用位运算 代替常规运算的高效点： 利用哈希值 与 旧的容量，可以得到哈希值取模后，是大于等于oldCap还是小于oldCap，等于0代表小于oldCap，应该存放在低位，否则存放在高位
                            if ((e.hash & oldCap) == 0) {
                                //给头尾节点指针赋值
                                if (loTail == null)
                                    loHead = e;
                                else
                                    loTail.next = e;
                                loTail = e;
                            }//高位也是相同的逻辑
                            else {
                                if (hiTail == null)
                                    hiHead = e;
                                else
                                    hiTail.next = e;
                                hiTail = e;
                            }//循环直到链表结束
                        } while ((e = next) != null);
                        //将低位链表存放在原index处，
                        if (loTail != null) {
                            loTail.next = null;
                            newTab[j] = loHead;
                        }
                        //将高位链表存放在新index处
                        if (hiTail != null) {
                            hiTail.next = null;
                            newTab[j + oldCap] = hiHead;
                        }
                    }
                }
            }
        }
        return newTab;
    }

除了对扩容后旧表数据的处理，其他的都好理解。这里具体看一下对链表和红黑树的处理。

链表的处理

java hash map扩容机制 hashmap扩容代码_红黑树

如上图所示，黄色部分代表数组桶，数字表示数组下标。无填充的部分表示hash冲突后形成的链表，数字表示计算完后的hash值。

结合上图不难理解，对链表的处理逻辑，这里主要定义了 high、low位的头、尾节点及一个临时变量。

代码 721行（jdk1.8）： if ((e.hash & oldCap) == 0) 这里比较巧妙。等于0的话，表示扩容后的下标在16之前，就是上面说的low位。否则的话就是在 16或16之后，即high位。不理解的话拿几个数据做一个与运算就好了。

最后将低位链表存放在原index处，将高位链表存放在新index处。新的index 就是 “原来的位置” + 原来的数组长度

红黑树的处理

同链表相似，红黑树也要拆分稳低位树和高位数，这里还要注意的一点是树小的话就转回链表了

/**
         * 将红黑中的节点拆分为较高位红黑树和低位红黑树，或者如果树现在太小，则取消树化
         *
         * @param index 当前红黑树所在位置
         * @param bit   数组容量
         */
        final void split(HashMap<K, V> map, Node<K, V>[] tab, int index, int bit) {
            //获得当前节点b
            TreeNode<K, V> b = this;
            TreeNode<K, V> loHead = null, loTail = null;
            TreeNode<K, V> hiHead = null, hiTail = null;
            //lc 地位红黑树的节点数，hc 高位红黑树的节点数
            int lc = 0, hc = 0;
            //从b节点开始遍历
            for (TreeNode<K, V> e = b, next; e != null; e = next) {
                next = (TreeNode<K, V>) e.next;
                //没次得到e的后节点next后，将e的后节点指空
                e.next = null;
                //注意此处&运算的数组容量没有-1
                //那么数组的容量值二进制表达必定为：1000 ...，所以此处计算只有两个结果，1或者0
                //所以TreeNode在新数组的位置要么是原位置，要么是原位置加上旧数组容量值的位置
                if ((e.hash & bit) == 0) {
                    //将loTail节点变成e节点的前节点，且loTail节点不存在
                    if ((e.prev = loTail) == null) {
                        //将e节点赋值给loHead节点
                        loHead = e;
                    } else {
                        //不存在则将e节点赋值给loTail的后节点
                        loTail.next = e;
                    }
                    //将e节点赋值给loTail节点
                    loTail = e;
                    //计算地位红黑树的节点数
                    ++lc;
                } else {
                    //以下操作和上方操作一样
                    if ((e.prev = hiTail) == null) {
                        hiHead = e;
                    } else {
                        hiTail.next = e;
                    }
                    hiTail = e;
                    ++hc;
                }
            }
            //如果地位红黑树存在
            if (loHead != null) {
                //如果地位红黑树节点小于红黑树瓦解阈值
                if (lc <= UNTREEIFY_THRESHOLD) {
                    //将地位红黑树转化为链表
                    tab[index] = loHead.untreeify(map);
                } else {
                    //否则将地位红黑树根节点放到数组上
                    tab[index] = loHead;
                    if (hiHead != null) {
                        //如果高位红黑树存在，不存在则说明原先的节点都还在当前红黑树上。不用变化
                        //否则将低位红黑树重新树化，虽然已经当前还是红黑树
                        //但是节点改变了，所以要重新再来一遍，梳理节点
                        loHead.treeify(tab);
                    }
                }
            }
            //以下操作与上方操作一样
            if (hiHead != null) {
                if (hc <= UNTREEIFY_THRESHOLD) {
                    tab[index + bit] = hiHead.untreeify(map);
                } else {
                    tab[index + bit] = loHead;
                    if (loHead != null) {
                        hiHead.treeify(tab);
                    }
                }
            }
        }

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。