程序员：HashMap讲解，分析扩容机制源码

一只刚刚上路的猿

2019-12-26

关注关注

具体看源码之前，我们先简单的说一下HashMap的底层数据结构

1、HashMap底层的数据结构是数组 + 链表 + 红黑树

2、我们需要先了解一下HashMap底层的两个变量

2-1：loadFactor: 加载因子，默认是0.75，这个值是经过反复测试最合适的值。

2-2：threshold: 当map里面的数据大于这个threshold就会进行扩容

程序员：HashMap讲解，分析扩容机制源码

现在来看一下HashMap的构造方法

hashMap的构造方法有4个。

1、空参构造方法，这个时候加载因子为默认的0.75，并且不会创建空间。

threshold 为0

数组为null

public HashMap() {

this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted

}

2、给定初始化容量大小，这个构造方法里面会直接去调用第三个构造方法

threshold 已经有值了

数组为null

public HashMap(int initialCapacity) {

this(initialCapacity, DEFAULT_LOAD_FACTOR);

}

3、给定初始化大小，和加载因子。

1、其实并不建议修改默认的加载因子。当然除非你很了解这里面的逻辑找到一个适合自己这个项目的加载因子

2、先是判断你给的初始化容量是否合法，如果合法的话就用这个初始化容量计算出 threshold

threshold 已经有值了

数组为null

public HashMap(int initialCapacity, float loadFactor) {

if (initialCapacity < 0)

throw new IllegalArgumentException("Illegal initial capacity: " +

initialCapacity);

if (initialCapacity > MAXIMUM_CAPACITY)

initialCapacity = MAXIMUM_CAPACITY;

if (loadFactor <= 0 || Float.isNaN(loadFactor))

throw new IllegalArgumentException("Illegal load factor: " + loadFactor);

this.loadFactor = loadFactor;

this.threshold = tableSizeFor(initialCapacity);

}

4、把一个Map作为参数传递过来，加载因子适应默认的0.75。把其它Map转化成HashMap

threshold 已经有值了

数组为也不为空了

public HashMap(Map<? extends K, ? extends V> m) {

this.loadFactor = DEFAULT_LOAD_FACTOR;

putMapEntries(m, false);

}

final void putMapEntries(Map<? extends K, ? extends V> m, boolean evict) {

int s = m.size();

if (s > 0) {

if (table == null) { // pre-size

float ft = ((float)s / loadFactor) + 1.0F;

int t = ((ft < (float)MAXIMUM_CAPACITY) ?

(int)ft : MAXIMUM_CAPACITY);

if (t > threshold)

threshold = tableSizeFor(t);

}

else if (s > threshold)

resize();

for (Map.Entry<? extends K, ? extends V> e : m.entrySet()) {

K key = e.getKey();

V value = e.getValue();

putVal(hash(key), key, value, false, evict);

}

让我们看看是HashMap是怎么进入扩容的

3-1：我们先从 put() 这个方法说起

public V put(K key, V value) {

return putVal(hash(key), key, value, false, true);

}

这个put方法底层是调用了一个叫 putVal 的方法，但是在这之前我们有必要看一下hash()这个方法。

直接使用对象.hashCode(), 可能会出现重复，所以这个hash是对生成的hashcode进行一下扰乱，让其重复性更低。

从这里也可以看到，HashMap只允许一个null键

static final int hash(Object key) {

int h;

return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);

}

3-2：下面我们看一下这个putVal方法

putVal源码：

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,

boolean evict) {

Node<K,V>[] tab; Node<K,V> p; int n, i;

if ((tab = table) == null || (n = tab.length) == 0)

n = (tab = resize()).length;

if ((p = tab[i = (n - 1) & hash]) == null)

tab[i] = newNode(hash, key, value, null);

else {

Node<K,V> e; K k;

if (p.hash == hash &&

((k = p.key) == key || (key != null && key.equals(k))))

e = p;

else if (p instanceof TreeNode)

e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);

else {

for (int binCount = 0; ; ++binCount) {

if ((e = p.next) == null) {

p.next = newNode(hash, key, value, null);

if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st

treeifyBin(tab, hash);

break;

}

if (e.hash == hash &&

((k = e.key) == key || (key != null && key.equals(k))))

break;

p = e;

}

if (e != null) { // existing mapping for key

V oldValue = e.value;

if (!onlyIfAbsent || oldValue == null)

e.value = value;

afterNodeAccess(e);

return oldValue;

}

++modCount;

if (++size > threshold)

resize();

afterNodeInsertion(evict);

return null;

}

这个源码看起来还是有点复杂的，考虑到很多同学可能和我一样数据结构并不是太好。我把它简化一下，提取里面的思想便于理解

final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) {

Node<K,V>[] tab; Node<K,V> p; int n, i;

if ((tab = table) == null || (n = tab.length) == 0){

// 当数据为null或者长度为0的时候进行扩，并发扩后的长度返回给n（前面说了hashMap底层最开始是个数组）

n = (tab = resize()).length;

}

// 之前可能有同学有疑问，hashcode那么长，为啥默认HashMap数组默认长度是16。其实最后的下标是经过处理的 (n - 1) & hash

if ((p = tab[i = (n - 1) & hash]) == null){

// 如果当前数组的下标，并没有数据，也就是说当前添加的数据是第一个，那就直接加入进去就好了。不需要排序啥的

tab[i] = newNode(hash, key, value, null);

}

else {

// 找到了数据下标，并且里面的已经有数据了，

// 这里就要找到当前数据的位置属于那里并加入进去，

// 还要判断当前长度是否大于我们设置的长度，大于就要把链转化成红黑树便于查找

}

++modCount;

// 判断当前长度是否大于需要扩的长度，其实也好理解，数组是可以装满的，但是链不可能满呀，但是长度超过一定的长度的时候链的性能就会很差了

if (++size > threshold)

resize();

// 节点插入后的操作，目前这个没有任何实现，里面是个空方法

afterNodeInsertion(evict);

return null;

}

3-3：总结进入扩容的两种情况

添加一个数据的时候，底层数组为空的时候

添加一个数据结束后，判断当前数据个数是否大于threshold （需要扩容）的大小，大于就进行扩容

注：因为数据是具体添加到数组里面的链表，所以不存在数组越界情况。

具体看一下扩容代码

扩容源码：

final Node<K,V>[] resize() {

Node<K,V>[] oldTab = table;

int oldCap = (oldTab == null) ? 0 : oldTab.length;

int oldThr = threshold;

int newCap, newThr = 0;

if (oldCap > 0) {

if (oldCap >= MAXIMUM_CAPACITY) {

threshold = Integer.MAX_VALUE;

return oldTab;

}

else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&

oldCap >= DEFAULT_INITIAL_CAPACITY)

newThr = oldThr << 1; // double threshold

}

else if (oldThr > 0) // initial capacity was placed in threshold

newCap = oldThr;

else { // zero initial threshold signifies using defaults

newCap = DEFAULT_INITIAL_CAPACITY;

newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);

}

if (newThr == 0) {

float ft = (float)newCap * loadFactor;

newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?

(int)ft : Integer.MAX_VALUE);

}

threshold = newThr;

@SuppressWarnings({"rawtypes","unchecked"})

Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];

table = newTab;

if (oldTab != null) {

for (int j = 0; j < oldCap; ++j) {

Node<K,V> e;

if ((e = oldTab[j]) != null) {

oldTab[j] = null;

if (e.next == null)

newTab[e.hash & (newCap - 1)] = e;

else if (e instanceof TreeNode)

((TreeNode<K,V>)e).split(this, newTab, j, oldCap);

else { // preserve order

Node<K,V> loHead = null, loTail = null;

Node<K,V> hiHead = null, hiTail = null;

Node<K,V> next;

do {

next = e.next;

if ((e.hash & oldCap) == 0) {

if (loTail == null)

loHead = e;

else

loTail.next = e;

loTail = e;

}

else {

if (hiTail == null)

hiHead = e;

else

hiTail.next = e;

hiTail = e;

}

} while ((e = next) != null);

if (loTail != null) {

loTail.next = null;

newTab[j] = loHead;

}

if (hiTail != null) {

hiTail.next = null;

newTab[j + oldCap] = hiHead;

}

return newTab;

}

同样的把源码进行一下简单的分享，去除复杂的内容

// 这个扩容方法就是

// 1、找到新的容量大小和新的threshold大小

// 2、把旧的数据全部复制到新的数组中去

final Node<K,V>[] resize() {

Node<K,V>[] oldTab = table;

int oldCap = (oldTab == null) ? 0 : oldTab.length;

int oldThr = threshold;

int newCap, newThr = 0;

// 非第一次扩容

if (oldCap > 0) {

if (oldCap >= MAXIMUM_CAPACITY) {

threshold = Integer.MAX_VALUE;

return oldTab;

}

else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY && oldCap >= DEFAULT_INITIAL_CAPACITY)

newThr = oldThr << 1; // double threshold

}

// 使用初始化容量或初始化容量+初始化加载因子参数的构造方法，第一次进入扩容

else if (oldThr > 0){

newCap = oldThr;

}

// 使用空参构造方法第一次扩容进入，使用参数为map的构造方法，第一次也会进入这个扩容方法

else {

newCap = DEFAULT_INITIAL_CAPACITY;

newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);

}

// 使用初始化容量或初始化容量+初始化加载因子参数的构造方法，第一次进入扩容

if (newThr == 0) {

float ft = (float)newCap * loadFactor;

newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ? (int)ft : Integer.MAX_VALUE);

}

threshold = newThr;

@SuppressWarnings({"rawtypes","unchecked"})

Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];

table = newTab;

// 把旧的数据全部复制到新的数组中去

if (oldTab != null) {

}

return newTab;

}

总结（面试的时候：请你说一下HashMap的扩容）：

HashMap底层数据结构是数组 + 链表 + 红黑树

真正的数据是存储在链表中的，链表的长度是无限的。所以这时候就引入一个变量 threshold

当第一次向map里面添加数据，或添加完数据后的大小，大于 threshold的大小，这时候就会进行扩容

先说一下非第一次扩容，这个相对简单点

1、如果当前的容量大小，大于等于HashMap规定的最大容量的话，直接让threshold等于Integer的最大值，就可以了。

2、一般情况当前数组长度是不会大于最大值的，所以这时候新的数组长度等于旧数组的2倍。如果新的数组长度小于HashMap规定的最大值，并且旧的数组长度也大于等于HashMap规定的默认大小容量大小（16），那么threshold扩大2倍，否则不变

非第一次扩容

1、HashMap，有四个构造方法。空参构造方法的threshold变量是0，其它构造方法threshold都有初始值。

2、当旧的threshold大于0的时候，新的数组容量大小就等于旧的threshold大小。新的threshold大小等于加载因子新的数组大小。

3、当旧的threshold不大于0的时候，新的数组大小就等于默认的大小（16），新的threshold大小，就等于默认的容量大小默认的加载因子大小

上面已经得出了新的容量大小和新的threshold的大小，后面只需要用新容量大小创建一个数组，把旧数组的内容复制进去就好了。

程序员：HashMap讲解，分析扩容机制源码

原文链接：https://blog.csdn.net/Tomwildboar/article/details/103656006

hashmap 源码程序员构造方法 threshold

一只刚刚上路的猿

0 关注 0 粉丝 0 动态

关注关注

HashSet源码分析:JDK源码系列

继续分析源码，上一篇文章把HashMap的分析完毕。本文开始分析HashSet简单的介绍一下。HashSet是一个无重复元素集合，内部使用HashMap实现，所以HashMap的特征耶继承了下来。存储的元素是无序的并且HashSet允许使用空的元素。如果多

SonicsTorm 2019-11-05

Rust 两个数组的交集 II HashMap

给定两个数组，编写一个函数来计算它们的交集。输出：[4,9]这道题的解题思路就是，把第一个数组出现的数字当作钥匙记录起来，并且记录有几把钥匙，然后遍历下一个数组，数字当作锁，打开一把匹配的锁需要消耗一个钥匙。然后没有钥匙了就打不开。最后记录互相匹配的钥匙和

归去来兮 2020-07-28

ConcurrentHashMap原理分析

CHM 的使用 ConcurrentHashMap 是 J.U.C 包里面提供的一个线程安全并且高效的 HashMap，所以 ConcurrentHashMap 在并发编程的场景中使用的频率比较高，那么这一节课我们就从 ConcurrentHashMap

dxyadc 2020-06-26

HashMap源码分析和面试准备

本篇涉及到的知识面比较广，无论你是小白还是有经验人士，都可快速理解hashmap，目的是理解知识并能通过面试，一些过于深入和细节的东西不在这里讨论。这种转换是一种压缩映射，也就是，散列值的空间通常远小于输入的空间，不同的输入可能会散列成相同的输出，所以不可

dbhllnr 2020-06-09

HashMap源码分析和面试准备

shawsun 2020-06-09

HashMap源码解析<一>put()方法

HashMap在进行put操作时有很多细节设计的确值得我们去学习，下面是对put方法的一些接单的介绍，如果有什么不足之处还希望大佬能给与指出；既然说到集合的底层原理，首先要介绍一下HashMap的底层数据结构：。JDK1.8以前底层的结构为数组+链表；JD

Bloddy 2020-06-08

HashMap 和 Hashtable 有什么区别？

1 存储：HashMap 运行 key 和 value 为 null，而 Hashtable 不允许。2 线程安全：Hashtable 是线程安全的，而 HashMap 是非线程安全的。3 推荐使用：在 Hashtable 的类注释可以看到，Hashtab

ZMichael 2020-06-02

HashMap源码解析

HashMap是面试中经常问到的一个知识点，也是判断一个候选人基础是否扎实的标准之一，因为通过HashMap可以引出很多知识点，比如数据结构、equals和hashcode方法，除此之外还可以引出线程安全的问题，HashMap是我在初学阶段学到的设计的最为

happylife 2020-05-31

HashMap 和 Hashtable 的区别

（如果你要保证线程安全的话就使用 ConcurrentHashMap 吧！对Null key 和Null value的支持： HashMap 中，null 可以作为键，这样的键只有一个，可以有一个或多个键所对应的值为 null。。HashMap 默认的初始

luohui 2020-05-31

cc分享java：深入理解java各种集合的线程安全

多个线程同时操作同一个variable，就可能会出现不可预知的结果。根据上面的解释，很容易想出相应的scenario。这样就实现了所谓的线程安全。线程安全就是说多线程访问同一代码，不会产生不确定的结果。编写线程安全的代码是低依靠线程同步。　　Vector和

付春杰Blog 2020-05-31

HashMap和HashTable的区别

Hashtable是java一开始发布时就提供的键值映射的数据结构，而HashMap产生于JDK1.2。虽然Hashtable比HashMap出现的早一些，但是现在Hashtable基本上已经被弃用了。而HashMap已经成为应用最为广泛的一种数据类型了。

shayuchaor 2020-05-30

深入理解Java编程性能调优——深入浅出HashMap的设计与优化

HashMap 作为我们日常使用最频繁的容器之一，相信你一定不陌生了。今天我们就从HashMap 的底层实现讲起，深度了解下它的设计与优化。我在 05 讲分享 List 集合类的时候，讲过 ArrayList 是基于数组的数据结构实现的，LinkedLis

ipqtjmqj 2020-05-19

最常见的Java面试题及答案汇总（二）

Collection接口在Java 类库中有很多具体的实现。Collection接口的意义是为各种具体的集合提供了最大化的统一操作方式，其直接继承接口有List与Set。Collections则是集合类的一个工具类/帮助类，其中提供了一系列静态方法，用于对

alicelmx 2020-05-19

HashMap源码分析

HashMap是一个底层用数组+链表实现的存储KV键值对数据结构，它允许null键和null值。HashMap的存储规则是，根据K的hashCode运算得到hash值，然后根据hash值运算得到下标，如果数组中该下标没有值就放入，有值就一个一个比较是否ha

凉白开 2020-04-16

JDK源码之HashMap 类分析

hashmap继承了AbstractMap,实现了Map接口和Cloneable接口,HashMap是基于哈希表(散列表)，实现Map接口的双列集合

spb 2020-04-14

数据结构 - HashMap

Entry是HashMap的基本组成单元，每一个Entry包含一个key-value键值对。static final int MAXIMUM_CAPACITY = 1 << 30;从源码中可以看出，hash算法实际上就键的hashCode与ha

范范 2020-03-27

java基础进阶篇(六)_HashTable------【java源码栈】

前面介绍了HashMap的结构和原理，这里介绍个类似HashMap的结构Hashtable。HashTable 官方解释是HashMap的轻量级实现, 和HashMap一样，Hashtable 也是一个散列表，它存储的内容是键值对映射。所以我们结合Hash

zhujiangtaotaise 2020-03-05

java基础进阶篇(五)_HashSet------【java源码栈】

对于HashSet而言，它是基于HashMap来实现的，底层采用HashMap来保存元素。HashSet中的元素都存放在HashMap的key上面，而value中的值都是统一的一个private static final Object PRESENT =

Bloddy 2020-03-04

数据结构对性能的影响

HashMap要根据已知元素数量进行初始化，否则会在数据Put的时候进行resize多次，在执行resize时需要创建新的数组，并且重新执行元素的hash，老数组又要回收，对GC和CPU都不友好。循环取元素用keySet，而没有使用EntrySet。查了一

waitwolf 2020-03-01

HashMap源码浅析

"HashMap"由“hash”和“map"两个单词组成，这里的”map"表示“映射”而不是“地图”的意思，两个单词连起来就是“哈希映射表”。Map是一个接口，它有TreeSet 、LinkedHashMap、Enu

zagnix 2020-02-21

安科网

程序员：HashMap讲解，分析扩容机制源码

一只刚刚上路的猿

一只刚刚上路的猿

相关推荐

HashSet源码分析:JDK源码系列

Rust 两个数组的交集 II HashMap

ConcurrentHashMap原理分析

HashMap源码分析和面试准备

HashMap源码分析和面试准备

HashMap源码解析<一>put()方法

HashMap 和 Hashtable 有什么区别？

HashMap源码解析

HashMap 和 Hashtable 的区别

cc分享java：深入理解java各种集合的线程安全

HashMap和HashTable的区别

深入理解Java编程性能调优——深入浅出HashMap的设计与优化

最常见的Java面试题及答案汇总（二）

HashMap源码分析

JDK源码之HashMap 类分析

数据结构 - HashMap

java基础进阶篇(六)_HashTable------【java源码栈】

java基础进阶篇(五)_HashSet------【java源码栈】

数据结构对性能的影响

HashMap源码浅析

一只刚刚上路的猿