java map 等瞰 java map index_Java

1. 前言

通过前面的文章,我们知道了什么是哈希表,Java的HashMap是什么、其底层的结构以及如何使用Java里面的HashMap。

总结一句话:HashMap是基于底层叫Entry[]数组实现的一种哈希表

那今天我们来稍微深入一点,讲解HashMap里面的一个点:存取(put/get)数据的时候,Entry数组index下标的计算。

1.1 hashCode,hash与index的概念

来回忆一下:

a).上一节讲到put/get一个元素的时候,会调用该元素的hashCode方法,比如下面的自定义KeyObject类。

java map 等瞰 java map index_数组_02

b).hashCode的数据会被用来计算hash值

java map 等瞰 java map index_java map 索引_03

如果细心的小伙伴,去print一下这个hash值,就会发现其实是一个非常大的整数,比如2028737这样的,显然这个hash值不会是底层Entry[]数组的index值。

所以总结一下:

hashCode:HashMap的Key对象里面的方法hashCode产生的值hash:通过hashCode的值,通过一定算法产生的hash值index:通过hash值计算产生的,HashMap底层数组Entry[]的偏移值那计算index的方法是什么呢?

1.2 index的计算原则

Entry[]数组的长度在初始化的时候会被指定,假定这个值为length。

那index的值就从 0 ~ length-1。所以index需要尽可能的平衡,也就是分布均匀,不能某些位置上存储特别多的数据,某些位置上又特别少。

前面我们说过,通过hash值来计算index,那使用什么办法可以满足:

性能高效均匀分析1.3 index的计算方法

1.3.1 取模运算

hash值为int,index需要映射到0 ~ length -1,最直观的使用取模运算,也就是:

index = hash值 % length这个时候index的值的范围就是 0 ~ length -1

但是,Java 官方没有采用这个办法,因为这种效率不是最高的。

1.3.2 位运算(为什么长度一定是2的n次方)

为了解决取模效率的问题,Java官方采用了位运算的方法。

index = hash值 & (length -1)

这个时候,如果要index的值的范围也是 0 ~ length -1,需要一个前置条件:

length的长度必须是2的n次幂。当length的长度是2的n次方时,有以下的公式成立:

java map 等瞰 java map index_java map 等瞰_04

因为:一个数num除以2n,相当于右移n位,那么移出去的那些数自然就是余数了,举个例子158除以8:

java map 等瞰 java map index_java map 索引_05

1.3.3 性能比较

看到这里会有人问,为什么取模运算会比位运算慢,慢多少呢?我们来做个实验:

java map 等瞰 java map index_Java_06

1.4 要点总结(常见问题)

如何计算index的为什么不用取模,要用位运算为什么长度一定是2的n次方