HashMap

  • HashMap是面试必问的知识点之一,也是java开发最常用的一种数据模型,HashMap属于复合结构,以key-value形式存储数据,其中key是不允许重复的但是允许为空,value是可以重复或为空的,在jdk1.8前,它的结构为数组+链表,在jdk1.8后变成了数组+单向链表+红黑树
  • 当JVM存储HashMap的K-V时,首先计算key的hash值,以此来确定插入的数组位置,但是这一hash值的位置可能已经存在有值,这时就顺延到同一hash值的元素的后面形成了单向链表,同一个链表上的Hash值是相同的,所以说数组存放的是链表!他的结构图:

    红黑树的阈值是8,当链表大于等于8时链表变成了红黑树结构,大大减少了查找的时间。
    这是源码的解释:
1/**
 2     * The bin count threshold for using a tree rather than list for a
 3     * bin.  Bins are converted to trees when adding an element to a
 4     * bin with at least this many nodes. The value must be greater
 5     * than 2 and should be at least 8 to mesh with assumptions in
 6     * tree removal about conversion back to plain bins upon
 7     * shrinkage.
 8     */
 9    static final int TREEIFY_THRESHOLD = 8;
10
11    /**
12     * The bin count threshold for untreeifying a (split) bin during a
13     * resize operation. Should be less than TREEIFY_THRESHOLD, and at
14     * most 6 to mesh with shrinkage detection under removal.
15     */
16    static final int UNTREEIFY_THRESHOLD = 6;

当长度低于6时会由红黑树转成链表,TreeNodes占用空间是普通Nodes的两倍,所以只有当bin包含足够多的节点时才会转成TreeNodes,而是否足够多就是由TREEIFY_THRESHOLD的值决定的,当bin中节点数变少时,又会转成普通的bin,这样就解析了为什么不是一开始就将其转换为TreeNodes,而是需要一定节点数才转为TreeNodes,说白了就是trade-off,空间和时间的权衡

  • hashmap是如何get值呢?
1public V get(Object key) {
 2        Node<K,V> e;
 3        return (e = getNode(hash(key), key)) == null ? null : e.value;
 4    }
 5      /**
 6     * Implements Map.get and related methods
 7     *
 8     * @param hash hash for key
 9     * @param key the key
10     * @return the node, or null if none
11     */
12    final Node<K,V> getNode(int hash, Object key) {
13        Node<K,V>[] tab;//Entry对象数组
14    Node<K,V> first,e; //在tab数组中经过散列的第一个位置
15    int n;
16    K k;
17    /*找到插入的第一个Node,方法是hash值和n-1相与,tab[(n - 1) & hash]*/
18    //也就是说在一条链上的hash值相同的
19        if ((tab = table) != null && (n = tab.length) > 0 &&(first = tab[(n - 1) & hash]) != null) {
20    /*检查第一个Node是不是要找的Node*/
21            if (first.hash == hash && // always check first node
22                ((k = first.key) == key || (key != null && key.equals(k))))//判断条件是hash值要相同,key值要相同
23                return first;
24      /*检查first后面的node*/
25            if ((e = first.next) != null) {
26                if (first instanceof TreeNode)
27                    return ((TreeNode<K,V>)first).getTreeNode(hash, key);
28                /*遍历后面的链表,找到key值和hash值都相同的Node*/
29                do {
30                    if (e.hash == hash &&
31                        ((k = e.key) == key || (key != null && key.equals(k))))
32                        return e;
33                } while ((e = e.next) != null);
34            }
35        }
36        return null;
37    }

get(key)方法时获取key的hash值,计算hash&(n-1)得到在链表数组中的位置first=tab[hash&(n-1)],先判断first的key是否与参数key相等,不等就遍历后面的链表找到相同的key值返回对应的Value值

  • HashMap是基于hashing的原理,我们使用put(key, value)存储对象到HashMap中,使用get(key)从HashMap中获取对象
  • 给put(key, value)方法传递键和值时,它先调用key.hashCode()方法,返回的hashCode值,用于找到bucket位置,来储存Entry对象
  • Map提供了一些常用方法,如keySet()、entrySet()等方法
  • keySet()方法返回值是Map中key值的集合;entrySet()的返回值也是返回一个Set集合,此集合的类型为Map.Entry
  • hashmap查询的时间复杂度,(最好O(1),最差O(n),如果是红黑O(logn))
  • 默认的负载因子0.75f:0.75是平衡了时间和空间等因素,负载因子越小桶的数量越多,读写的时间复杂度越低(极限情况O(1), 哈希碰撞的可能性越小);负载因子越大桶的数量越少,读写的时间复杂度越高(极限情况O(n), 哈希碰撞可能性越高)