HashMap名词解释
- HasMap 存储Key-Value的键值对。 每个键值对 也叫做Entry
- 这些键值对(Entity) 分散存储在一个数组当中,这个数组就是HashMap的主干
- HashMap数组的每个元素的初始值都为Null
- 常用的HashMap方法: GET 、Put
PUT的原理
- 利用一个哈希函数来确定Entry的插入位置(index)
- index = Hash(“apple”);
- HashMap 长度有限,当插入的Entry 越来越多,会出现index 冲突
- 解决方案链表
- HashMap数组的每一个元素不止是一个Entry对象,也是一个链表的头节点。每一个Entry对象通过Next指针指向它的下一个Entry节点。当新来的Entry映射到冲突的数组位置时,只需要插入到对应的链表即可;
- 注意点:新来的Entry节点插入链表时,使用的是“头插法”,之所以把Entry6放在头节点,是因为HashMap的发明者认为,后插入的Entry被查找的可能性更大。
GET方法的原理
- key 做一次hash映射得到对应的index
- 如遇到Hash冲突,则顺应节点查找
HashMap 初始长度
- 默认初始长度16,每次扩展和手动初始化时,长度必须是2的幂
长度16的特殊意义
- 为了能够实现 hash函数的均匀分布(利用Key的HashCode值 做某种运算)
- 简单实现 低效版 取模运算
- 高效hash算法 位运算方式(公式 index = HashCode(Key) & (Length - 1))
- 举例如下(Book的演示)
- 计算book的hashcode,结果为十进制的3029737,二进制的101110001110101110 1001。
- 假定HashMap长度是默认的16,计算Length-1的结果为十进制的15,二进制的1111。
- 把以上两个结果做与运算,101110001110101110 1001 & 1111 = 1001,十进制是9,所以 index=9。
- 结论:Hash算法最终得到的index结果,完全取决于Key的Hashcode值的最后几位。
思考:
- HashMap的长度是10 的情况 HashCode计算
- 结论:虽然HashCode的倒数第二第三位从0变成了1,但是运算的结果都是1001。也就是说,当HashMap长度为10的时候,有些index结果的出现几率会更大,而有些index结果永远不会出现(比如0111)!
这样,显然不符合Hash算法均匀分布的原则。 - 反观长度16或者其他2的幂,Length-1的值是所有二进制位全为1,这种情况下,index的结果等同于HashCode后几位的值。只要输入的HashCode本身分布均匀,Hash算法的结果就是均匀的。
参考 程序猿小灰 HashMap的理解