共计 3129 个字符,预计需要花费 8 分钟才能阅读完成。
前言
众所皆知,ArrayList 是线程不平安的,它的所有办法都没有加锁,那么有没有线程平安并且性能高的类呢?那就是 CopyOnWriteArrayList
实现原理
首先来看它的要害数据结构:
/** The lock protecting all mutators */
final transient ReentrantLock lock = new ReentrantLock();
/** The array, accessed only via getArray/setArray. */
private transient volatile Object[] array;
能够看到,底层和 ArrayList 一样,用数组来保留元素,但它多了把独占锁 lock,来保障线程平安。
上面间接进入主题,看看它的 add()办法如何实现的:
public boolean add(E e) {
final ReentrantLock lock = this.lock;
lock.lock();
try {Object[] elements = getArray();
int len = elements.length;
Object[] newElements = Arrays.copyOf(elements, len + 1);
newElements[len] = e;
setArray(newElements);
return true; } finally {lock.unlock();
}
}
代码逻辑很清晰明了:
第一步,获取数组的排他锁
第二步,获取数组元素和长度 n,拷贝一个 n + 1 长度的新数组
第三步,把待增加的元素 e 放在最初一个地位
第四步,笼罩旧的数组,返回 true 示意增加胜利
第五步,开释锁
简而言之,它的实现思路就跟它的命名一样,CopyOnWrite,“写时复制”,增加元素的时候,先复制数组,增加实现后笼罩掉旧的数组,这些步骤是在加锁的环境实现的,也就是说这个过程中不会有其余线程同时也在写数组,这就保障了写操作的线程平安。
再来看 set()办法:
public E set(int index, E element) {
final ReentrantLock lock = this.lock;
lock.lock();
try {Object[] elements = getArray();
E oldValue = get(elements, index);
// 如果新值与旧值不同,则拷贝一个新数组,并在 index 处设置新值
if (oldValue != element) {
int len = elements.length;
Object[] newElements = Arrays.copyOf(elements, len);
newElements[index] = element;
setArray(newElements);
} else {
// Not quite a no-op; ensures volatile write semantics
// 新值与旧值雷同,为了保障 volatile 语义,也笼罩下数组,即便内容雷同。setArray(elements);
}
return oldValue;
} finally {lock.unlock();
}
}
再来看 remove()办法
public E remove(int index) {
final ReentrantLock lock = this.lock;
lock.lock();
try {Object[] elements = getArray();
int len = elements.length;
E oldValue = get(elements, index);
int numMoved = len - index - 1;
// 如果删除的是最初一个元素
if (numMoved == 0)
setArray(Arrays.copyOf(elements, len - 1));
else {Object[] newElements = new Object[len - 1];
// 分两步复制
System.arraycopy(elements, 0, newElements, 0, index);
System.arraycopy(elements, index + 1, newElements, index,
numMoved);
setArray(newElements);
}
return oldValue;
} finally {lock.unlock();
}
}
再来看 get()办法:
public E get(int index) {return get(getArray(), index);
}
final Object[] getArray() {return array;}
private E get(Object[] a, int index) {return (E) a[index];
}
能够看到,它的 get 办法分为 2 步,先获取数组,再获取 index 地位的元素,这 2 步都是没有加锁的?为什么不须要加锁呢?
下面提到,add()是先拷贝原数组,而后在拷贝的数组上操作的,在 setArray()之前对原数组并没有影响,因而读的时候不须要加锁。尽管不须要加锁,但会呈现数据弱一致性问题, 下图阐明
线程 A | 线程 B |
---|---|
a = getArray() | |
remove(a, index) | |
get(a, index) |
在 A 线程获取了数组 (a=array) 后,还没有来得及获取 index 地位的元素 a[index],线程 B 删除了 index 地位的元素,并将 array 援用指向新的数组 (array=newArray),然而因为线程 A 用的是栈区的数组援用 a,它援用的还是删除元素前的数组,因而它还是会拜访到 index 这个被删除的元素,因而说会有数据的弱一致性问题,但不会抛 ConcurrentModificationException 异样。
它的迭代器 iterator 也是有这种弱一致性的个性,迭代对象是数组的快照,迭代过程中,如果其余线程批改了数组,对迭代器来说是不可见的。
代码如下:
public Iterator<E> iterator() {return new COWIterator<E>(getArray(), 0);
}
// COW = Copy On Write
static final class COWIterator<E> implements ListIterator<E> {
/** Snapshot of the array */
// 数组元素的一份快照
private final Object[] snapshot;
/** Index of element to be returned by subsequent call to next. */
// 以后迭代的地位 - 光标
private int cursor;
private COWIterator(Object[] elements, int initialCursor) {
cursor = initialCursor;
snapshot = elements;
}
public boolean hasNext() {return cursor < snapshot.length;}
public boolean hasPrevious() {return cursor > 0;}
@SuppressWarnings("unchecked")
public E next() {if (! hasNext())
throw new NoSuchElementException();
return (E) snapshot[cursor++];
}
}
由此能够看出,CopyOnWriteArrayList 适宜用在读多写少的场景,性能会比 Vector 快,因为 Vector 的所有办法都加了锁,包含读。
最初提下,CopyOnWriteArraySet 就是用 CopyOnWriteArrayList 实现的,所以原理大同小异,有趣味的同学本人去看下源码吧。