我始终保持的一个信念是,扭转不了大环境,就扭转小环境,做本人力不从心的事件。你不能决定太阳几点升起,但能够决定本人几点起床。
咱们晓得,ConcurrentHashMap(1.8)这个并发汇合框架是线程平安的,当你看到源码的get操作时,会发现get操作全程是没有加任何锁的,这也是这篇博文探讨的问题——为什么它不须要加锁呢?
ConcurrentHashMap的简介
我想有根底的同学晓得在jdk1.7中是采纳Segment + HashEntry + ReentrantLock的形式进行实现的,而1.8中放弃了Segment臃肿的设计,取而代之的是采纳Node + CAS + Synchronized来保障并发平安进行实现。
- JDK1.8的实现升高锁的粒度,JDK1.7版本锁的粒度是基于Segment的,蕴含多个HashEntry,而JDK1.8锁的粒度就是HashEntry(首节点)
- JDK1.8版本的数据结构变得更加简略,使得操作也更加清晰晦涩,因为曾经应用synchronized来进行同步,所以不须要分段锁的概念,也就不须要Segment这种数据结构了,因为粒度的升高,实现的复杂度也减少了
- JDK1.8应用红黑树来优化链表,基于长度很长的链表的遍历是一个很漫长的过程,而红黑树的遍历效率是很快的,代替肯定阈值的链表,这样造成一个最佳拍档。
get操作源码
- 首先计算hash值,定位到该table索引地位,如果是首节点合乎就返回
- 如果遇到扩容的时候,会调用标记正在扩容节点ForwardingNode的find办法,查找该节点,匹配就返回
- 以上都不合乎的话,就往下遍历节点,匹配就返回,否则最初就返回null
//会发现源码中没有一处加了锁public V get(Object key) { Node<K, V>[] tab; Node<K, V> e, p; int n, eh; K ek; int h = spread(key.hashCode()); //计算hash if ((tab = table) != null && (n = tab.length) > 0 && (e = tabAt(tab, (n - 1) & h)) != null) {//读取首节点的Node元素 if ((eh = e.hash) == h) { //如果该节点就是首节点就返回 if ((ek = e.key) == key || (ek != null && key.equals(ek))) return e.val; } //hash值为负值示意正在扩容,这个时候查的是ForwardingNode的find办法来定位到nextTable来 //eh=-1,阐明该节点是一个ForwardingNode,正在迁徙,此时调用ForwardingNode的find办法去nextTable里找。 //eh=-2,阐明该节点是一个TreeBin,此时调用TreeBin的find办法遍历红黑树,因为红黑树有可能正在旋转变色,所以find里会有读写锁。 //eh>=0,阐明该节点下挂的是一个链表,间接遍历该链表即可。 else if (eh < 0) return (p = e.find(h, key)) != null ? p.val : null; while ((e = e.next) != null) {//既不是首节点也不是ForwardingNode,那就往下遍历 if (e.hash == h && ((ek = e.key) == key || (ek != null && key.equals(ek)))) return e.val; } } return null;}
get没有加锁的话,ConcurrentHashMap是如何保障读到的数据不是脏数据的呢?
volatile退场
对于可见性,Java提供了volatile关键字来保障可见性、有序性。但不保障原子性。
一般的共享变量不能保障可见性,因为一般共享变量被批改之后,什么时候被写入主存是不确定的,当其余线程去读取时,此时内存中可能还是原来的旧值,因而无奈保障可见性。
- volatile关键字对于根本类型的批改能够在随后对多个线程的读保持一致,然而对于援用类型如数组,实体bean,仅仅保障援用的可见性,但并不保障援用内容的可见性。。
- 禁止进行指令重排序。
背景:为了进步处理速度,处理器不间接和内存进行通信,而是先将零碎内存的数据读到外部缓存(L1,L2或其余)后再进行操作,但操作完不晓得何时会写到内存。
- 如果对申明了volatile的变量进行写操作,JVM就会向处理器发送一条指令,将这个变量所在缓存行的数据写回到零碎内存。然而,就算写回到内存,如果其余处理器缓存的值还是旧的,再执行计算操作就会有问题。
- 在多处理器下,为了保障各个处理器的缓存是统一的,就会实现缓存一致性协定,当某个CPU在写数据时,如果发现操作的变量是共享变量,则会告诉其余CPU告知该变量的缓存行是有效的,因而其余CPU在读取该变量时,发现其有效会从新从主存中加载数据。
总结下来:
第一:应用volatile关键字会强制将批改的值立刻写入主存;
第二:应用volatile关键字的话,当线程2进行批改时,会导致线程1的工作内存中缓存变量的缓存行有效(反映到硬件层的话,就是CPU的L1或者L2缓存中对应的缓存行有效);
第三:因为线程1的工作内存中缓存变量的缓存行有效,所以线程1再次读取变量的值时会去主存读取。
是加在数组上的volatile吗?
/** * The array of bins. Lazily initialized upon first insertion. * Size is always a power of two. Accessed directly by iterators. */transient volatile Node<K, V>[] table;
咱们晓得volatile能够润饰数组的,只是意思和它外表上看起来的样子不同。举个栗子,volatile int array[10]是指array的地址是volatile的而不是数组元素的值是volatile的.
用volatile润饰的Node
get操作能够无锁是因为Node的元素val和指针next是用volatile润饰的,在多线程环境下线程A批改结点的val或者新增节点的时候是对线程B可见的。
static class Node<K, V> implements Map.Entry<K, V> { final int hash; final K key; //能够看到这些都用了volatile润饰 volatile V val; volatile Node<K, V> next; Node(int hash, K key, V val, Node<K, V> next) { this.hash = hash; this.key = key; this.val = val; this.next = next; } public final K getKey() { return key; } public final V getValue() { return val; } public final int hashCode() { return key.hashCode() ^ val.hashCode(); } public final String toString() { return key + "=" + val; } public final V setValue(V value) { throw new UnsupportedOperationException(); } public final boolean equals(Object o) { Object k, v, u; Map.Entry<?, ?> e; return ((o instanceof Map.Entry) && (k = (e = (Map.Entry<?, ?>) o).getKey()) != null && (v = e.getValue()) != null && (k == key || k.equals(key)) && (v == (u = val) || v.equals(u))); } /** * Virtualized support for map.get(); overridden in subclasses. */ Node<K, V> find(int h, Object k) { Node<K, V> e = this; if (k != null) { do { K ek; if (e.hash == h && ((ek = e.key) == k || (ek != null && k.equals(ek)))) return e; } while ((e = e.next) != null); } return null; }}
既然volatile润饰数组对get操作没有成果那加在数组上的volatile的目标是什么呢?
其实就是为了使得Node数组在扩容的时候对其余线程具备可见性而加的volatile。
总结
- 在1.8中ConcurrentHashMap的get操作全程不须要加锁,这也是它比其余并发汇合比方HashTable、用Collections.synchronizedMap()包装的HashMap平安效率高的起因之一。
- get操作全程不须要加锁是因为Node的成员val是用volatile润饰的,和数组用volatile润饰没有关系。
- 数组用volatile润饰次要是在数组扩容的时候保障可见性。