关于java:通俗易懂的JUC源码剖析CopyOnWriteArrayList

51次阅读

共计 3129 个字符,预计需要花费 8 分钟才能阅读完成。

前言

众所皆知,ArrayList 是线程不平安的,它的所有办法都没有加锁,那么有没有线程平安并且性能高的类呢?那就是 CopyOnWriteArrayList

实现原理

首先来看它的要害数据结构:

/** The lock protecting all mutators */
final transient ReentrantLock lock = new ReentrantLock();
/** The array, accessed only via getArray/setArray. */
private transient volatile Object[] array;

能够看到,底层和 ArrayList 一样,用数组来保留元素,但它多了把独占锁 lock,来保障线程平安。
上面间接进入主题,看看它的 add()办法如何实现的:

public boolean add(E e) {
    final ReentrantLock lock = this.lock;
    lock.lock();
    try {Object[] elements = getArray();
        int len = elements.length;
        Object[] newElements = Arrays.copyOf(elements, len + 1);
        newElements[len] = e;
        setArray(newElements);
        return true; } finally {lock.unlock();
    }
}

代码逻辑很清晰明了:
第一步,获取数组的排他锁
第二步,获取数组元素和长度 n,拷贝一个 n + 1 长度的新数组
第三步,把待增加的元素 e 放在最初一个地位
第四步,笼罩旧的数组,返回 true 示意增加胜利
第五步,开释锁
简而言之,它的实现思路就跟它的命名一样,CopyOnWrite,“写时复制”,增加元素的时候,先复制数组,增加实现后笼罩掉旧的数组,这些步骤是在加锁的环境实现的,也就是说这个过程中不会有其余线程同时也在写数组,这就保障了写操作的线程平安。

再来看 set()办法:

public E set(int index, E element) {
    final ReentrantLock lock = this.lock;
    lock.lock();
    try {Object[] elements = getArray();
        E oldValue = get(elements, index);
        // 如果新值与旧值不同,则拷贝一个新数组,并在 index 处设置新值
        if (oldValue != element) {
            int len = elements.length;
            Object[] newElements = Arrays.copyOf(elements, len);
            newElements[index] = element;
            setArray(newElements);
        } else {
            // Not quite a no-op; ensures volatile write semantics
            // 新值与旧值雷同,为了保障 volatile 语义,也笼罩下数组,即便内容雷同。setArray(elements);
        }
        return oldValue;
    } finally {lock.unlock();
    }
}

再来看 remove()办法

public E remove(int index) {
    final ReentrantLock lock = this.lock;
    lock.lock();
    try {Object[] elements = getArray();
        int len = elements.length;
        E oldValue = get(elements, index);
        int numMoved = len - index - 1;
        // 如果删除的是最初一个元素
        if (numMoved == 0)
            setArray(Arrays.copyOf(elements, len - 1));
        else {Object[] newElements = new Object[len - 1];
            // 分两步复制
            System.arraycopy(elements, 0, newElements, 0, index);
            System.arraycopy(elements, index + 1, newElements, index,
            numMoved);
            setArray(newElements);
        }
        return oldValue;
   } finally {lock.unlock();
   }
}

再来看 get()办法:

public E get(int index) {return get(getArray(), index);
}
final Object[] getArray() {return array;}
private E get(Object[] a, int index) {return (E) a[index];
}

能够看到,它的 get 办法分为 2 步,先获取数组,再获取 index 地位的元素,这 2 步都是没有加锁的?为什么不须要加锁呢?
下面提到,add()是先拷贝原数组,而后在拷贝的数组上操作的,在 setArray()之前对原数组并没有影响,因而读的时候不须要加锁。尽管不须要加锁,但会呈现数据弱一致性问题, 下图阐明

线程 A 线程 B
a = getArray()
remove(a, index)
get(a, index)

在 A 线程获取了数组 (a=array) 后,还没有来得及获取 index 地位的元素 a[index],线程 B 删除了 index 地位的元素,并将 array 援用指向新的数组 (array=newArray),然而因为线程 A 用的是栈区的数组援用 a,它援用的还是删除元素前的数组,因而它还是会拜访到 index 这个被删除的元素,因而说会有数据的弱一致性问题,但不会抛 ConcurrentModificationException 异样。
它的迭代器 iterator 也是有这种弱一致性的个性,迭代对象是数组的快照,迭代过程中,如果其余线程批改了数组,对迭代器来说是不可见的。
代码如下:

public Iterator<E> iterator() {return new COWIterator<E>(getArray(), 0);
}
// COW = Copy On Write
static final class COWIterator<E> implements ListIterator<E> {
    /** Snapshot of the array */
    // 数组元素的一份快照
    private final Object[] snapshot;
    /** Index of element to be returned by subsequent call to next.  */
    // 以后迭代的地位 - 光标
    private int cursor;
    private COWIterator(Object[] elements, int initialCursor) {
        cursor = initialCursor;
        snapshot = elements;
   }
    public boolean hasNext() {return cursor < snapshot.length;}
    public boolean hasPrevious() {return cursor > 0;}
    @SuppressWarnings("unchecked")
    public E next() {if (! hasNext())
            throw new NoSuchElementException();
        return (E) snapshot[cursor++];
    }
 }

由此能够看出,CopyOnWriteArrayList 适宜用在读多写少的场景,性能会比 Vector 快,因为 Vector 的所有办法都加了锁,包含读。
最初提下,CopyOnWriteArraySet 就是用 CopyOnWriteArrayList 实现的,所以原理大同小异,有趣味的同学本人去看下源码吧。

正文完
 0