Java 集合框架(七):ConcurrentHashMap
ConcurrentHashMap
ConcurrentHashMap 是一个能够保证线程安全的并发容器
。
为什么使用concurrentHashMap
HashTable 是一个典型的同步容器
。虽然 HashTable 的所有方法都用 synchronzied 修饰,但是如果我们编程时将 get 和 put 这类的操作写成了非原子操作,就会有线程安全问题了。虽然单个方法都是线程安全的,但是组合到一起就不是了。所以只能叫同步容器
。另外使用 synchronized 锁使得 HashTable 的效率比较低。
Collections.synchronizedMap()方法同理。
ConcurrentHashMap 在 JDK 1.7 中采用分段锁计数,其中 Segment 继承于 ReentrantLock。不会像 HashTable 那样不管是 put 还是 get 都需要锁。JDK 1.8 弃用了分段锁,采用 CAS + synchronized 来保证线程安全,也可以叫节点锁。
ConcurrentHashMap 为什么高效
HashTable 低效的原因就是因为所有访问 HashTable 的线程都争夺一把锁。如果容器有很多把锁,每次只锁住容器的一部分数据。当多个线程访问容器里面的不同部分时线程就不存在锁的竞争,这样可以提高访问效率。1.7 中锁住的力度是分段,1.8 中锁住的力度是节点。
先来看 JDK 1.7 的原理。
JDK 1.7 ConcurrentHashMap 的结构:
- ConcurrentHashMap 由 Segment 和 HashEntry 组成。
- Segment 继承自 ReentrantLock。
- HashEntry 用来存储键值对。
- ConcurrentHashMap 包含了一个 Segment 数组,每个 Segment 包含一个 HashEntry 数组并且守护它。当修改 HashEntry 数组数据时,需要先获得 Segment 锁。每个 HashEntry 元素又是链表结构元素。
get 方法
- 根据 key,计算出 hashcode。
- 根据 hashCode 定位 Segment,如果 Segment 不为空,Segment 里面的 table 也不为空,对 Segment 里面的 Entry 进行遍历,如果 key 存在,返回 key 对应的 value。
- 否则返回 null。
整个 get 操作不需要加锁。那么它时如何保证读操作线程安全的那,原因是所有 Entry 都用 volatile 修饰了,可以保证线程之间的可见性,这也是 volatile 替换锁的经典应用场景。
put 方法
- 计算 key 的 hashcode。
- 根据 hashcode 计算出 Segment。
- 调用 Segment 的 put 方法。
- 获取锁,保证 put 线程安全。
- 定位到具体的 HashEntry。
- 遍历 HashEntry 链表,查看 key 是否存在,存在则更新,不存在则插入。
- 释放锁。
JDK 1.8 的 ConcurrentHashMap
/** * 存放node的数组,大小是2的幂次方 */ transient volatile Node[] table; /** * 扩容时用于存放数据的变量,平时为null */ private transient volatile Node[] nextTable; /** * 通过CAS更新,记录容器的容量大小 */ private transient volatile long baseCount; /** * 控制标志符 * 负数: 代表正在进行初始化或扩容操作,其中-1表示正在初始化,-N 表示有N-1个线程正在进行扩容操作 * 正数或0: 代表hash表还没有被初始化,这个数值表示初始化或下一次进行扩容的大小,类似于扩容阈值 * 它的值始终是当前ConcurrentHashMap容量的0.75倍,这与loadfactor是对应的。 * 实际容量 >= sizeCtl,则扩容 */ private transient volatile int sizeCtl; /** * 下次transfer方法的起始下标index加上1之后的值 */ private transient volatile int transferIndex; /** * CAS自旋锁标志位 */ private transient volatile int cellsBusy; /** * counter cell表,长度总为2的幂次 */ private transient volatile CounterCell[] counterCells;
Node 节点类与 HashMap 中定义很相似,value 和 next 属性都使用 volatile 保证了内存的可见性。
static class Node implements Map.Entry { final int hash; final K key; volatile V val; volatile Node next; ... }
put 方法
ConcurrentHashMap的put操作与HashMap很相似,但ConcurrentHashMap不允许null作为key和value,并且由于需要保证线程安全,有以下两个多线程情况:
①.如果一个或多个线程正在对ConcurrentHashMap进行扩容操作,当前线程也要进入扩容的操作中。这个扩容的操作之所以能被检测到,是因为transfer方法会将已经操作过扩容桶头结点置为ForwardingNode节点,如果检测到需要插入的位置被该节点占有,就帮助进行扩容。
②.如果检测到要插入的节点是非空且不是ForwardingNode节点,就对这个节点加锁,这样就保证了线程安全。
get方法
给定一个key来确定value的时候,必须满足两个条件 key相同 hash值相同,对于节点可能在链表或树上的情况,需要分别去查找。