关于后端:ConcurrentHashMap-是如何保证线程安全的

47次阅读

共计 3703 个字符，预计需要花费 10 分钟才能阅读完成。

我始终保持的一个信念是，扭转不了大环境，就扭转小环境，做本人力不从心的事件。你不能决定太阳几点升起，但能够决定本人几点起床。

咱们晓得，ConcurrentHashMap(1.8) 这个并发汇合框架是线程平安的，当你看到源码的 get 操作时，会发现 get 操作全程是没有加任何锁的，这也是这篇博文探讨的问题——为什么它不须要加锁呢？

我想有根底的同学晓得在 jdk1.7 中是采纳 Segment + HashEntry + ReentrantLock 的形式进行实现的，而 1.8 中放弃了 Segment 臃肿的设计，取而代之的是采纳 Node + CAS + Synchronized 来保障并发平安进行实现。

JDK1.8 的实现升高锁的粒度，JDK1.7 版本锁的粒度是基于 Segment 的，蕴含多个 HashEntry，而 JDK1.8 锁的粒度就是 HashEntry（首节点）
JDK1.8 版本的数据结构变得更加简略，使得操作也更加清晰晦涩，因为曾经应用 synchronized 来进行同步，所以不须要分段锁的概念，也就不须要 Segment 这种数据结构了，因为粒度的升高，实现的复杂度也减少了
JDK1.8 应用红黑树来优化链表，基于长度很长的链表的遍历是一个很漫长的过程，而红黑树的遍历效率是很快的，代替肯定阈值的链表，这样造成一个最佳拍档。

首先计算 hash 值，定位到该 table 索引地位，如果是首节点合乎就返回
如果遇到扩容的时候，会调用标记正在扩容节点 ForwardingNode 的 find 办法，查找该节点，匹配就返回
以上都不合乎的话，就往下遍历节点，匹配就返回，否则最初就返回 null

// 会发现源码中没有一处加了锁
public V get(Object key) {Node<K, V>[] tab; Node<K, V> e, p; int n, eh; K ek;
    int h = spread(key.hashCode()); // 计算 hash
    if ((tab = table) != null && (n = tab.length) > 0 &&
            (e = tabAt(tab, (n - 1) & h)) != null) {// 读取首节点的 Node 元素
        if ((eh = e.hash) == h) { // 如果该节点就是首节点就返回
            if ((ek = e.key) == key || (ek != null && key.equals(ek)))
                return e.val;
        }
        //hash 值为负值示意正在扩容，这个时候查的是 ForwardingNode 的 find 办法来定位到 nextTable 来
        //eh=-1，阐明该节点是一个 ForwardingNode，正在迁徙，此时调用 ForwardingNode 的 find 办法去 nextTable 里找。//eh=-2，阐明该节点是一个 TreeBin，此时调用 TreeBin 的 find 办法遍历红黑树，因为红黑树有可能正在旋转变色，所以 find 里会有读写锁。//eh>=0，阐明该节点下挂的是一个链表，间接遍历该链表即可。else if (eh < 0)
            return (p = e.find(h, key)) != null ? p.val : null;
        while ((e = e.next) != null) {// 既不是首节点也不是 ForwardingNode，那就往下遍历
            if (e.hash == h &&
                    ((ek = e.key) == key || (ek != null && key.equals(ek))))
                return e.val;
        }
    }
    return null;
}

get 没有加锁的话，ConcurrentHashMap 是如何保障读到的数据不是脏数据的呢？

对于可见性，Java 提供了 volatile 关键字来保障可见性、有序性。但不保障原子性。

一般的共享变量不能保障可见性，因为一般共享变量被批改之后，什么时候被写入主存是不确定的，当其余线程去读取时，此时内存中可能还是原来的旧值，因而无奈保障可见性。

volatile 关键字对于根本类型的批改能够在随后对多个线程的读保持一致，然而对于援用类型如数组，实体 bean，仅仅保障援用的可见性，但并不保障援用内容的可见性。。
禁止进行指令重排序。

背景：为了进步处理速度，处理器不间接和内存进行通信，而是先将零碎内存的数据读到外部缓存（L1，L2 或其余）后再进行操作，但操作完不晓得何时会写到内存。

如果对申明了 volatile 的变量进行写操作，JVM 就会向处理器发送一条指令，将这个变量所在缓存行的数据写回到零碎内存。然而，就算写回到内存，如果其余处理器缓存的值还是旧的，再执行计算操作就会有问题。
在多处理器下，为了保障各个处理器的缓存是统一的，就会实现缓存一致性协定，当某个 CPU 在写数据时，如果发现操作的变量是共享变量，则会告诉其余 CPU 告知该变量的缓存行是有效的，因而其余 CPU 在读取该变量时，发现其有效会从新从主存中加载数据。

总结下来：

第一：应用 volatile 关键字会强制将批改的值立刻写入主存；

第二：应用 volatile 关键字的话，当线程 2 进行批改时，会导致线程 1 的工作内存中缓存变量的缓存行有效（反映到硬件层的话，就是 CPU 的 L1 或者 L2 缓存中对应的缓存行有效）；

第三：因为线程 1 的工作内存中缓存变量的缓存行有效，所以线程 1 再次读取变量的值时会去主存读取。

/**
 * The array of bins. Lazily initialized upon first insertion.
 * Size is always a power of two. Accessed directly by iterators.
 */
transient volatile Node<K, V>[] table;

咱们晓得 volatile 能够润饰数组的，只是意思和它外表上看起来的样子不同。举个栗子，volatile int array[10] 是指 array 的地址是 volatile 的而不是数组元素的值是 volatile 的.

get 操作能够无锁是因为 Node 的元素 val 和指针 next 是用 volatile 润饰的，在多线程环境下线程 A 批改结点的 val 或者新增节点的时候是对线程 B 可见的。

static class Node<K, V> implements Map.Entry<K, V> {
    final int hash;
    final K key;
    // 能够看到这些都用了 volatile 润饰
    volatile V val;
    volatile Node<K, V> next;

    Node(int hash, K key, V val, Node<K, V> next) {
        this.hash = hash;
        this.key = key;
        this.val = val;
        this.next = next;
    }

    public final K getKey() { return key;}

    public final V getValue() { return val;}

    public final int hashCode() { return key.hashCode() ^ val.hashCode();}

    public final String toString() { return key + "=" + val;}

    public final V setValue(V value) {throw new UnsupportedOperationException();
    }

    public final boolean equals(Object o) {
        Object k, v, u; Map.Entry<?, ?> e;
        return ((o instanceof Map.Entry) &&
                (k = (e = (Map.Entry<?, ?>) o).getKey()) != null &&
                (v = e.getValue()) != null &&
                (k == key || k.equals(key)) &&
                (v == (u = val) || v.equals(u)));
    }

    /**
     * Virtualized support for map.get(); overridden in subclasses.
     */
    Node<K, V> find(int h, Object k) {
        Node<K, V> e = this;
        if (k != null) {
            do {
                K ek;
                if (e.hash == h &&
                        ((ek = e.key) == k || (ek != null && k.equals(ek))))
                    return e;
            } while ((e = e.next) != null);
        }
        return null;
    }
}

既然 volatile 润饰数组对 get 操作没有成果那加在数组上的 volatile 的目标是什么呢？

其实就是为了使得 Node 数组在扩容的时候对其余线程具备可见性而加的 volatile。

在 1.8 中 ConcurrentHashMap 的 get 操作全程不须要加锁，这也是它比其余并发汇合比方 HashTable、用 Collections.synchronizedMap() 包装的 HashMap 平安效率高的起因之一。
get 操作全程不须要加锁是因为 Node 的成员 val 是用 volatile 润饰的，和数组用 volatile 润饰没有关系。
数组用 volatile 润饰次要是在数组扩容的时候保障可见性。

正文完

后端

发表至：后端

2020-07-30

0

关于后端:一分钟学一个-Linux-命令-ps

关于后端:Golang名库观止-配置解析神器viper使用详解

关于后端:老项目更新skynet版本

关于后端:Go基础篇彻底搞懂-Channel-实现原理

关于code:声网-RTE-秋季挑战赛正式启动6-万奖金等你赢还有机会进入招聘绿色通道

关于后端:ConcurrentHashMap-是如何保证线程安全的

ConcurrentHashMap 的简介

get 操作源码

volatile 退场

是加在数组上的 volatile 吗?

用 volatile 润饰的 Node

总结

Just My Socks（注册教程内含优惠码）

关于后端:ConcurrentHashMap-是如何保证线程安全的

ConcurrentHashMap 的简介

get 操作源码

volatile 退场

是加在数组上的 volatile 吗?

用 volatile 润饰的 Node

总结

Just My Socks（注册教程 内含优惠码）

Just My Socks（注册教程内含优惠码）