HashMap分析（JDK1.8）

原创

Dongguabai 2022-12-22 01:59:04 ©著作权

文章标签 数据数组链表 文章分类 虚拟化云计算

©著作权归作者所有：来自51CTO博客作者Dongguabai的原创作品，请联系作者获取转载授权，否则将追究法律责任

这里是基于JDK1.8。

HashMap分析（JDK1.8）_数组

可以看出HashMap继承了AbstractMap，实现了Map。

先看看HashMap中的几个关键的属性：

默认初始容量是16：

HashMap分析（JDK1.8）_数据_02

也很好理解，1的二进制还是1：

HashMap分析（JDK1.8）_数据_03

向左位移四位：

HashMap分析（JDK1.8）_数组_04

HashMap分析（JDK1.8）_链表_05

最大容量很大：

HashMap分析（JDK1.8）_链表_06

负载因子，主要用来扩展HashMap的容量，建议不要进行修改：

HashMap分析（JDK1.8）_数组_07

初始容量是16，那么就是在容量到达12的时候开始进行扩容。扩容越大，数据会越平均，检索速度会越快，但是占用的空间会比较大。比较小扩容会比较频繁，空间占用就会比较大。

HashMap/HashSet的初始值还要考虑加载因子:
为了降低哈希冲突的概率(Key的哈希值按数组大小取模后，如果落在同一个数组下标上，将组成一条需要遍历的Entry链)，默认当HashMap中的键值对达到数组大小的75%时，即会触发扩容。因此，如果预估容量是100，即需要设定100/0.75 +1＝135的数组大小。vjkit的MapUtil的Map创建函数封装了该计算。
如果希望加快Key查找的时间，还可以进一步降低加载因子，加大初始大小，以降低哈希冲突的概率。

链表节点转化为树形节点的阈值，即当链表节点到达8的时候就会转化为树形的结构：

HashMap分析（JDK1.8）_数组_08

树节点转化为链表节点的阈值：

HashMap分析（JDK1.8）_数据_09

树的最小容量：

HashMap分析（JDK1.8）_数组_10

先看看put()方法：

HashMap分析（JDK1.8）_数据_11

主要是调用了putVal()方法，中间又调用了hash()方法，先看看hash()方法：

HashMap分析（JDK1.8）_链表_12

当key==null的时候就返回0（从这里也可以看出来HashMap的key是可以为null的），不为null就行计算key的hashCode()赋值给h（HashMap先根据hashcode方法定位，再比较equals方法），随后h和h向右偏移16位的值做一个抑或（可以参看javascript:void(0)）。

这里选择位移16位是因为h是一个int类型的值，int值的取值范围是32位，向右位移16位刚好是32位的一半。

假设这是完整的数据，左边是属于高位，右边是属于低位：

HashMap分析（JDK1.8）_数组_13

向右位移16位就相当于整个低位的数据就没有了，高位的数据都到低位这边来了，原来的高位数据再用0去填充，然后新值和旧值再去做抑或：

HashMap分析（JDK1.8）_数据_14

这样的好处就是在没有外部数据接入的情况下，充分的使用了hashCode算出来的值进行计算。这样计算出来的hash值会相对的分散，只有尽量分散才尽可能的可以减少hash冲突，散列之后就不容易重复。

可以自己写个Demo测试一下：

HashMap分析（JDK1.8）_数据_15

HashMap分析（JDK1.8）_链表_16

在看putVal()方法前先看看Node，Node是HashMap中定义的一个类：

HashMap分析（JDK1.8）_链表_17

有hash值、K和V，还有一个next，就是指向下一个Node，这就明显是一个链表。

再看看putVal()方法：

//从这里可以看出HashMap的一个结构，数组加上链表：

HashMap分析（JDK1.8）_数组_18

将table赋值给tab，如果是空的就执行下面的逻辑：

HashMap分析（JDK1.8）_链表_19

关于table，在第一次使用时初始化，分配时，长度总是两个幂，也可以为0。

HashMap分析（JDK1.8）_数据_20

初始肯定是空的就会执行resize()方法进行扩容，肯定会执行下面这一段：

HashMap分析（JDK1.8）_数组_21

这里的容量的初始值是16。

newThr阈值就是初始值乘以负载因子。

综合也可以看出HashMap在new出来的时候，并没有创建一个16位长度的Node数组，而是在第一次put的时候才会创建一个初始的空间，里面有懒加载的思想，就是你用的时候才去初始容量。

再接着看putVal()方法：

HashMap分析（JDK1.8）_链表_22

首先，put的数据肯定要落到数组中的某一个节点中去，那具体是落到哪一个节点中去呢，就是通过这一段代码计算出来的。

先看这段：

i = (n - 1) & hash

i的值等于(n-1)&hash，这其实是一个取%的过程。因为最大容量就是16，而hash值必然是一个比较大的数据，这里使用了一个&运算（可以参看：javascript:void(0)），因为&运算的效率是高于%的。

这里n-1，初始值的n是16，减一就是15：

HashMap分析（JDK1.8）_数据_23

再去&一个值：

HashMap分析（JDK1.8）_数据_24

这里n必须要是2的倍数，因为2次幂有个特征，就是1的后面全是0：

比如32是这样：

HashMap分析（JDK1.8）_数据_25

2是这样：

HashMap分析（JDK1.8）_数据_26

而减去1了之后就是1变成0，后面全部是都是1：

HashMap分析（JDK1.8）_数组_27

再配合&运算，就可以%了。

再接着代码往下看：

HashMap分析（JDK1.8）_数据_28

找到了索引之后，如果是空的，就执行下面的方法，去创建一个Node对象并赋值，要注意的是这个时候的next是null。

HashMap分析（JDK1.8）_数组_29

如果不为空就执行else里面的代码：

HashMap分析（JDK1.8）_数组_30

会判断节点是不是一个TreeNode的类型：

HashMap分析（JDK1.8）_数据_31

这个p是哪里来的呢：

HashMap分析（JDK1.8）_链表_32

目前暂时还是Node还不是TreeNode，先分析不是TreeNode的情况：

HashMap分析（JDK1.8）_链表_33

从这里大概可以进一步看出结构就是数组加上链表（JDK1.8就是简单的数组加链表）：

HashMap分析（JDK1.8）_数组_34

继续看代码：

HashMap分析（JDK1.8）_数组_35

如果next Node是空的，就会创建一个新的Node放进去，即如果数组中的位置被占用了，就会到next Node。而且这一段代码是在一个for循环里面，简单点说，就是因为这个链表可能很长，就会一直找，直到找个那个next Node是空的Node就放进next Node中去，这个说法也不准确。在这段代码中看到了一个熟悉的变量TREEIFY_THRESHOLD，即到了8的时候会把这个Node转化为一个TreeNode。

也就是说，当节点数大于等于7的时候，就会转换成树形结构（红黑树）：

HashMap分析（JDK1.8）_链表_36