集合类源码(六)Map(HashMap, Hashtable, LinkedHashMap, WeakHashMap)
HashMap
内部结构
内部是一个Node数组,每个Node都是链表的头,当链表的大小达到8之后链表转变成红黑树。
put操作
final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) { Node<K,V>[] tab; Node<K,V> p; int n, i; // 当table为空或者长度为0,执行resize if ((tab = table) == null || (n = tab.length) == 0) n = (tab = resize()).length; // 根据hash计算对应数组下标 if ((p = tab[i = (n - 1) & hash]) == null) // 如果没有值,直接插入 tab[i] = newNode(hash, key, value, null); else { // 如果有值 Node<K,V> e; K k; if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k)))) // key存在,把当前节点引用存在e中 e = p; else if (p instanceof TreeNode) // 如果是树节点,插入树中。这里也一样,如果key冲突了,就返回冲突节点的引用,存储在e中 e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value); else { // 插入链表 for (int binCount = 0; ; ++binCount) { // 插入到链表末尾 if ((e = p.next) == null) { p.next = newNode(hash, key, value, null); // 此时如果 binCount大于等于7(因为是从0开始),则将链表转变成红黑树 if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st treeifyBin(tab, hash); break; } // 找到元素,break if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k)))) break; // 向后遍历 p = e; } } // 修改e所在位置的值(这个位置代码的作用就是处理链表中和树中的冲突key) if (e != null) { // existing mapping for key V oldValue = e.value; // 新value覆盖旧value if (!onlyIfAbsent || oldValue == null) e.value = value; afterNodeAccess(e); // 返回旧value return oldValue; } } ++modCount; // 容量达到阈值,扩容 if (++size > threshold) resize(); afterNodeInsertion(evict); return null; }
流程可以概括为:如果Node数组为空则先按照默认容量初始化数组。利用计算得到的hsah值确定数组下标,
1. 如果下标所在位置的Node为null,则直接新创建节点放在此处;
2. 如果下标所在位置的Node不为null,则判断是否已存在相同key的Node,有则临时存储冲突key涉及的Node的引用;
3. 如果key不冲突,则判断当前位置的Node的类型,如果为TreeNode,则将其插入树中,如果和树中已有的key冲突了,把涉及到的节点的引用返回并临时存储;如果不是TreeNode,则从头开始遍历链表,把新结点插入到链表尾部,插完之后判断是否达到链表的阈值,决定是否进行红黑树的转变。
4. 如果有冲突key需要处理,也就是临时变量存储的Node引用不为空,则用新value覆盖旧的value,并返回旧的value。
5. 如果没有冲突key,则判断添加完毕之后是否需要扩容。
下面说一下扩容
// 初始化或者加倍table的大小。如果table为空,则按照默认容量初始化; // 如果table不为空,则根据规则把老数组的数据放到新数组中。 final Node<K,V>[] resize() { // 老数组:扩容之前的数组 Node<K,V>[] oldTab = table; // 如果老数组为空,老容量为0 int oldCap = (oldTab == null) ? 0 : oldTab.length; // 老的扩容阈值,默认为0(扩容阈值=容量*负载因子,默认情况下达到容量的75%即需要扩容) int oldThr = threshold; int newCap, newThr = 0; // 老容量大于0,也就是老数组不为空 if (oldCap > 0) { // 如果老容量大于等于最大容量 if (oldCap >= MAXIMUM_CAPACITY) { // 扩容阈值设置为Integer的最大值 threshold = Integer.MAX_VALUE; // 返回旧容量 return oldTab; } // 新容量=2*旧容量;新容量小于最大容量 并且 老容量大于等于默认初始化容量(16) else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY && oldCap >= DEFAULT_INITIAL_CAPACITY) // 新扩容阈值=2*老扩容阈值 newThr = oldThr << 1; // double threshold } // 如果老的扩容阈值大于0 else if (oldThr > 0) // initial capacity was placed in threshold // 新容量 = 老的扩容阈值 newCap = oldThr; else { // zero initial threshold signifies using defaults // 老的扩容阈值等于0,也就是初始化的时候【这里可以看出,在这个地方进行了初始化的工作:设置默认容量,设置扩容阈值】 // 新容量等于默认的容量 newCap = DEFAULT_INITIAL_CAPACITY; // 新的扩容阈值等于默认容量的75% newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY); } if (newThr == 0) { // 如果新扩容阈值等于0,则设置新的扩容阈值(新容量的75%) float ft = (float)newCap * loadFactor; newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ? (int)ft : Integer.MAX_VALUE); } // 更新扩容阈值! threshold = newThr; @SuppressWarnings({"rawtypes","unchecked"}) // 按照新容量new了一个新的Node数组 Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap]; // 更新table! table = newTab; // 第一次初始化为oldTab=null,不走这个 if (oldTab != null) { // 这里才是真正意义上的扩容操作! // 遍历老数组 for (int j = 0; j < oldCap; ++j) { Node<K,V> e; // 老数组当前位置的元素不为null if ((e = oldTab[j]) != null) { // 置空,这里可以看出:table中存放的只是Node的引用 oldTab[j] = null; // 如果没有后继元素 if (e.next == null) // 根据当前元素的hash,放进新数组对应的位置 newTab[e.hash & (newCap - 1)] = e; else if (e instanceof TreeNode) // 如果当前元素类型为TreeNode,主要分为两个部分:1. 将树进行节点拆分 2. 如果达到退化阈值6,将把红黑树退化成链表 ((TreeNode<K,V>)e).split(this, newTab, j, oldCap); else { // 对链表的拆分,实际上和上一步类似,都是把原结构拆分成high和low两部分 // low链的head和tail Node<K,V> loHead = null, loTail = null; // high链的head和tail Node<K,V> hiHead = null, hiTail = null; Node<K,V> next; // 查看循环条件可知:遍历原链表e,一直到最后e.next=null do { // 下一个节点 next = e.next; // 根据条件:(e.hash & oldCap) == 0 把原链表划分成两部分 if ((e.hash & oldCap) == 0) { if (loTail == null) // low链表为空,直接放在头结点 loHead = e; else // 否则放在尾部 loTail.next = e; // 移动尾指针 loTail = e; } else { // 过程同上 if (hiTail == null) hiHead = e; else hiTail.next = e; hiTail = e; } } while ((e = next) != null); // 把low链放在新表j的位置上。新表的下标位置与旧表一致都为j if (loTail != null) { loTail.next = null; newTab[j] = loHead; } // 把high链放在新表[j+oldCap]的位置上 if (hiTail != null) { hiTail.next = null; newTab[j + oldCap] = hiHead; } } } } } // 返回新table return newTab; }
总结一下过程:
1. 如果table为null,则按照默认配置初始化,容量为16,扩容阈值为16*0.75=12【也就是添加完第13个元素的时候启动扩容】。
2. 如果table不为null:①、如果老容量大于0,则新容量=2*老容量,新扩容阈值=2*老扩容阈值。②、在不满足①的前提下,新容量=老的扩容阈值。③、在不满足①个②的前提下,初始化新容量为默认的16,新扩容阈值为12。
3. 如果新的扩容阈值为0,则将其设置为新容量的%75。然后更新HashMap的成员变量threshold为新的扩容阈值。
4. 利用前面计算出来的新容量,new一个新的Node数组。然后更新HashMap的成员变量table为新的数组。
5. 如果老数组里面有数据,则将老数组里的数据转移到新数组。遍历老数组,①:当前元素的后继为null,直接把当前元素放在新数组的e.hash & (newCap - 1)位置上。②:如果当前节点有后继元素并且元素类型为TreeNode,则按照树的规则进行拆分;如果元素数量达到阈值6,则退化成一个链表。③:如果当前节点有后继元素并且元素类型为Node,则按照(e.hash & oldCap) == 0规则将链表拆分为两部分,一部分放在新数组j的位置上,一部分放在新数组j+oldCap位置上。
6. 返回新数组。
简单来讲:
1. 当table需要初始化或者需要扩容的时候执行resize。初始化的时候按照默认值进行初始化(容量=16,扩容阈值=12);扩容的时候新容量是老容量的2倍,扩容阈值也是老扩容阈值的2倍。
2. 每次扩容都会新建一个数组,然后将老table中的元素re-hash到新的table中, 但元素在新旧table中的位置存在一定的联系:要么下标相同,要么相差一个oldCap(原table的大小)。
未完待续
Hashtable
--
LinkedHashMap
--
WeakHashMap
--
.