集合类源码（六）Map（HashMap, Hashtable, LinkedHashMap, WeakHashMap）

hell0kitty

2019-12-17

关注关注

HashMap

内部结构

集合类源码（六）Map（HashMap, Hashtable, LinkedHashMap, WeakHashMap）

内部是一个Node数组，每个Node都是链表的头，当链表的大小达到8之后链表转变成红黑树。

put操作

final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) {
    Node<K,V>[] tab; Node<K,V> p; int n, i;
    // 当table为空或者长度为0，执行resize
    if ((tab = table) == null || (n = tab.length) == 0)
        n = (tab = resize()).length;
    // 根据hash计算对应数组下标
    if ((p = tab[i = (n - 1) & hash]) == null)
        // 如果没有值，直接插入
        tab[i] = newNode(hash, key, value, null);
    else {
        // 如果有值
        Node<K,V> e; K k;
        if (p.hash == hash &&
            ((k = p.key) == key || (key != null && key.equals(k))))
            // key存在，把当前节点引用存在e中
            e = p;
        else if (p instanceof TreeNode)
            // 如果是树节点，插入树中。这里也一样，如果key冲突了，就返回冲突节点的引用，存储在e中
            e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
        else {
            // 插入链表
            for (int binCount = 0; ; ++binCount) {
                // 插入到链表末尾
                if ((e = p.next) == null) {
                    p.next = newNode(hash, key, value, null);
                    // 此时如果 binCount大于等于7（因为是从0开始），则将链表转变成红黑树
                    if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                        treeifyBin(tab, hash);
                    break;
                }
                // 找到元素，break
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    break;
                // 向后遍历
                p = e;
            }
        }
        // 修改e所在位置的值（这个位置代码的作用就是处理链表中和树中的冲突key）
        if (e != null) { // existing mapping for key
            V oldValue = e.value;
            // 新value覆盖旧value
            if (!onlyIfAbsent || oldValue == null)
                e.value = value;
            afterNodeAccess(e);
            // 返回旧value
            return oldValue;
        }
    }
    ++modCount;
    // 容量达到阈值，扩容
    if (++size > threshold)
        resize();
    afterNodeInsertion(evict);
    return null;
}

流程可以概括为：如果Node数组为空则先按照默认容量初始化数组。利用计算得到的hsah值确定数组下标，
1. 如果下标所在位置的Node为null，则直接新创建节点放在此处；
2. 如果下标所在位置的Node不为null，则判断是否已存在相同key的Node，有则临时存储冲突key涉及的Node的引用；
3. 如果key不冲突，则判断当前位置的Node的类型，如果为TreeNode，则将其插入树中，如果和树中已有的key冲突了，把涉及到的节点的引用返回并临时存储；如果不是TreeNode，则从头开始遍历链表，把新结点插入到链表尾部，插完之后判断是否达到链表的阈值，决定是否进行红黑树的转变。
4. 如果有冲突key需要处理，也就是临时变量存储的Node引用不为空，则用新value覆盖旧的value，并返回旧的value。
5. 如果没有冲突key，则判断添加完毕之后是否需要扩容。

下面说一下扩容

// 初始化或者加倍table的大小。如果table为空，则按照默认容量初始化；
// 如果table不为空，则根据规则把老数组的数据放到新数组中。
final Node<K,V>[] resize() {
    // 老数组：扩容之前的数组
    Node<K,V>[] oldTab = table;
    // 如果老数组为空，老容量为0
    int oldCap = (oldTab == null) ? 0 : oldTab.length;
    // 老的扩容阈值，默认为0（扩容阈值=容量*负载因子，默认情况下达到容量的75%即需要扩容）
    int oldThr = threshold;
    int newCap, newThr = 0;
    // 老容量大于0，也就是老数组不为空
    if (oldCap > 0) {
        // 如果老容量大于等于最大容量
        if (oldCap >= MAXIMUM_CAPACITY) {
            // 扩容阈值设置为Integer的最大值
            threshold = Integer.MAX_VALUE;
            // 返回旧容量
            return oldTab;
        }
        // 新容量=2*旧容量；新容量小于最大容量 并且 老容量大于等于默认初始化容量（16）
        else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                 oldCap >= DEFAULT_INITIAL_CAPACITY)
            // 新扩容阈值=2*老扩容阈值
            newThr = oldThr << 1; // double threshold
    }
    // 如果老的扩容阈值大于0
    else if (oldThr > 0) // initial capacity was placed in threshold
        // 新容量 = 老的扩容阈值
        newCap = oldThr;
    else {               // zero initial threshold signifies using defaults
        // 老的扩容阈值等于0，也就是初始化的时候【这里可以看出，在这个地方进行了初始化的工作：设置默认容量，设置扩容阈值】
        // 新容量等于默认的容量
        newCap = DEFAULT_INITIAL_CAPACITY;
        // 新的扩容阈值等于默认容量的75%
        newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
    }
    if (newThr == 0) {
        // 如果新扩容阈值等于0，则设置新的扩容阈值（新容量的75%）
        float ft = (float)newCap * loadFactor;
        newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                  (int)ft : Integer.MAX_VALUE);
    }
    // 更新扩容阈值！
    threshold = newThr;
    @SuppressWarnings({"rawtypes","unchecked"})
        // 按照新容量new了一个新的Node数组
        Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
    // 更新table！
    table = newTab;
    // 第一次初始化为oldTab=null，不走这个
    if (oldTab != null) {
        // 这里才是真正意义上的扩容操作！
        // 遍历老数组
        for (int j = 0; j < oldCap; ++j) {
            Node<K,V> e;
            // 老数组当前位置的元素不为null
            if ((e = oldTab[j]) != null) {
                // 置空，这里可以看出：table中存放的只是Node的引用
                oldTab[j] = null;
                // 如果没有后继元素
                if (e.next == null)
                    // 根据当前元素的hash，放进新数组对应的位置
                    newTab[e.hash & (newCap - 1)] = e;
                else if (e instanceof TreeNode)
                    // 如果当前元素类型为TreeNode，主要分为两个部分：1. 将树进行节点拆分 2. 如果达到退化阈值6，将把红黑树退化成链表
                    ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
                else { // 对链表的拆分，实际上和上一步类似，都是把原结构拆分成high和low两部分
                    // low链的head和tail
                    Node<K,V> loHead = null, loTail = null;
                    // high链的head和tail
                    Node<K,V> hiHead = null, hiTail = null;
                    Node<K,V> next;
                    // 查看循环条件可知：遍历原链表e，一直到最后e.next=null
                    do {
                        // 下一个节点
                        next = e.next;
                        // 根据条件：(e.hash & oldCap) == 0 把原链表划分成两部分
                        if ((e.hash & oldCap) == 0) {
                            if (loTail == null)
                                // low链表为空，直接放在头结点
                                loHead = e;
                            else
                                // 否则放在尾部
                                loTail.next = e;
                            // 移动尾指针
                            loTail = e;
                        }
                        else {
                            // 过程同上
                            if (hiTail == null)
                                hiHead = e;
                            else
                                hiTail.next = e;
                            hiTail = e;
                        }
                    } while ((e = next) != null);
                    // 把low链放在新表j的位置上。新表的下标位置与旧表一致都为j 
                    if (loTail != null) {
                        loTail.next = null;
                        newTab[j] = loHead;
                    }
                    // 把high链放在新表[j+oldCap]的位置上
                    if (hiTail != null) {
                        hiTail.next = null;
                        newTab[j + oldCap] = hiHead;
                    }
                }
            }
        }
    }
    // 返回新table
    return newTab;
}

总结一下过程：

1. 如果table为null，则按照默认配置初始化，容量为16，扩容阈值为16*0.75=12【也就是添加完第13个元素的时候启动扩容】。
2. 如果table不为null：①、如果老容量大于0，则新容量=2*老容量，新扩容阈值=2*老扩容阈值。②、在不满足①的前提下，新容量=老的扩容阈值。③、在不满足①个②的前提下，初始化新容量为默认的16，新扩容阈值为12。
3. 如果新的扩容阈值为0，则将其设置为新容量的%75。然后更新HashMap的成员变量threshold为新的扩容阈值。
4. 利用前面计算出来的新容量，new一个新的Node数组。然后更新HashMap的成员变量table为新的数组。
5. 如果老数组里面有数据，则将老数组里的数据转移到新数组。遍历老数组，①：当前元素的后继为null，直接把当前元素放在新数组的e.hash & (newCap - 1)位置上。②：如果当前节点有后继元素并且元素类型为TreeNode，则按照树的规则进行拆分；如果元素数量达到阈值6，则退化成一个链表。③：如果当前节点有后继元素并且元素类型为Node，则按照(e.hash & oldCap) == 0规则将链表拆分为两部分，一部分放在新数组j的位置上，一部分放在新数组j+oldCap位置上。
6. 返回新数组。

简单来讲：

1. 当table需要初始化或者需要扩容的时候执行resize。初始化的时候按照默认值进行初始化（容量=16，扩容阈值=12）；扩容的时候新容量是老容量的2倍，扩容阈值也是老扩容阈值的2倍。
2. 每次扩容都会新建一个数组，然后将老table中的元素re-hash到新的table中, 但元素在新旧table中的位置存在一定的联系：要么下标相同，要么相差一个oldCap(原table的大小)。

未完待续