乐趣区

关于后端:教你如何理解CopyOnWriteArrayList写时复制容器

# 写入时复制(CopyOnWrite)思维

写入时复制(CopyOnWrite,简称 COW)思维是计算机程序设计畛域中的一种优化策略。其核心思想是,如果有多个调用者(Callers)同时要求雷同的资源(如内存或者是磁盘上的数据存储),他们会独特获取雷同的指针指向雷同的资源,直到某个调用者视图批改资源内容时,零碎才会真正复制一份专用正本(private copy)给该调用者,而其余调用者所见到的最后的资源依然放弃不变。

这过程对其余的调用者都是通明的(transparently)。此做法次要的长处是如果调用者没有批改资源,就不会有正本(private copy)被创立,因而多个调用者只是读取操作时能够共享同一份资源。

# CopyOnWriteArrayList 的实现原理

在应用 CopyOnWriteArrayList 之前,咱们先浏览其源码理解下它是如何实现的。以下代码是向 CopyOnWriteArrayList 中 add 办法的实现(向 CopyOnWriteArrayList 里增加元素),能够发现在增加的时候是须要加锁的,否则多线程写的时候会 Copy 出 N 个正本进去。
《2020 最新 Java 根底精讲视频教程和学习路线!》

/**
 * Appends the specified element to the end of this list. * * @param e element to be appended to this list * @return <tt>true</tt> (as specified by {@link Collection#add}) */
    public boolean add(E e) {
    final ReentrantLock lock = this.lock;
    lock.lock();
    try {Object[] elements = getArray();
        int len = elements.length;
        Object[] newElements = Arrays.copyOf(elements, len + 1);
        newElements[len] = e;
        setArray(newElements);
        return true;
    } finally {lock.unlock();
    }
    }

读的时候不须要加锁,如果读的时候有多个线程正在向 CopyOnWriteArrayList 增加数据,读还是会读到旧的数据,因为写的时候不会锁住旧的 CopyOnWriteArrayList。

public E get(int index) {return get(getArray(), index);
}

JDK 中并没有提供 CopyOnWriteMap,咱们能够参考 CopyOnWriteArrayList 来实现一个,根本代码如下:

import java.util.Collection;
import java.util.Map;
import java.util.Set;
 
public class CopyOnWriteMap<K, V> implements Map<K, V>, Cloneable {
    private volatile Map<K, V> internalMap;
 
    public CopyOnWriteMap() {internalMap = new HashMap<K, V>();
    }
 
    public V put(K key, V value) {synchronized (this) {Map<K, V> newMap = new HashMap<K, V>(internalMap);
            V val = newMap.put(key, value);
            internalMap = newMap;
            return val;
        }
    }
 
    public V get(Object key) {return internalMap.get(key);
    }
 
    public void putAll(Map<? extends K, ? extends V> newData) {synchronized (this) {Map<K, V> newMap = new HashMap<K, V>(internalMap);
            newMap.putAll(newData);
            internalMap = newMap;
        }
    }
}

实现很简略,只有理解了 CopyOnWrite 机制,咱们能够实现各种 CopyOnWrite 容器,并且在不同的利用场景中应用。

# 几个要点

  • 实现了 List 接口
  • 外部持有一个 ReentrantLock lock = new ReentrantLock();
  • 底层是用 volatile transient 申明的数组 array
  • 读写拆散,写时复制出一个新的数组,实现插入、批改或者移除操作后将新数组赋值给 array

「注:」

volatile(挥发物、易变的):变量修饰符,只能用来润饰变量。volatile 润饰的成员变量在每次被线程拜访时,都强制从共享内存中重读该成员变量的值。而且,当成员变量产生变 化时,强制线程将变动值回写到共享内存。这样在任何时刻,两个不同的线程总是看到某个成员变量的同一个值。

# 增删改查

1)增

public boolean add(E e) {
    final ReentrantLock lock = this.lock;
    // 取得锁
    lock.lock();
    try {Object[] elements = getArray();
        int len = elements.length;
        // 复制一个新的数组
        Object[] newElements = Arrays.copyOf(elements, len + 1);
        // 插入新值
        newElements[len] = e;
        // 将新的数组指向原来的援用
        setArray(newElements);
        return true;
    } finally {
        // 开释锁
        lock.unlock();}
}

   
public void add(int index, E element) {
    final ReentrantLock lock = this.lock;
    lock.lock();
    try {Object[] elements = getArray();
        int len = elements.length;
        if (index > len || index < 0)
            throw new IndexOutOfBoundsException("Index:"+index+
                                                ", Size:"+len);
        Object[] newElements;
        int numMoved = len - index;
        if (numMoved == 0)
            newElements = Arrays.copyOf(elements, len + 1);
        else {newElements = new Object[len + 1];
            System.arraycopy(elements, 0, newElements, 0, index);
            System.arraycopy(elements, index, newElements, index + 1,
                             numMoved);
        }
        newElements[index] = element;
        setArray(newElements);
    } finally {lock.unlock();
    }
}

2)删

public E remove(int index) {
    final ReentrantLock lock = this.lock;
    // 取得锁
    lock.lock();
    try {Object[] elements = getArray();
        int len = elements.length;
        E oldValue = get(elements, index);
        int numMoved = len - index - 1;
        if (numMoved == 0)
            // 如果删除的元素是最初一个,间接复制该元素前的所有元素到新的数组
            setArray(Arrays.copyOf(elements, len - 1));
        else {
            // 创立新的数组
            Object[] newElements = new Object[len - 1];
            // 将 index+ 1 至最初一个元素向前挪动一格
            System.arraycopy(elements, 0, newElements, 0, index);
            System.arraycopy(elements, index + 1, newElements, index,
                             numMoved);
            setArray(newElements);
        }
        return oldValue;
    } finally {lock.unlock();
    }
}

3)改

public E set(int index, E element) {
    final ReentrantLock lock = this.lock;
    // 取得锁
    lock.lock();
    try {Object[] elements = getArray();
        E oldValue = get(elements, index);

        if (oldValue != element) {
            int len = elements.length;
            // 创立新数组
            Object[] newElements = Arrays.copyOf(elements, len);
            // 替换元素
            newElements[index] = element;
            // 将新数组指向原来的援用
            setArray(newElements);
        } else {
            // Not quite a no-op; ensures volatile write semantics
            setArray(elements);
        }
        return oldValue;
    } finally {
        // 开释锁
        lock.unlock();}
}

4)查

// 间接获取 index 对应的元素
public E get(int index) {return get(getArray(), index);}
private E get(Object[] a, int index) {return (E) a[index];}

# CopyOnWrite 的利用场景

CopyOnWrite 并发容器用于读多写少的并发场景。比方白名单,黑名单,商品类目标拜访和更新场景,如果咱们有一个搜寻网站,用户在这个网站的搜寻框中,输出关键字搜寻内容,然而某些关键字不容许被搜寻。这些不能被搜寻的关键字会被放在一个黑名单当中,黑名单每天晚上更新一次。当用户搜寻时,会查看以后关键字在不在黑名单当中,如果在,则提醒不能搜寻。实现代码如下:

import java.util.Map;
 
import com.ifeve.book.forkjoin.CopyOnWriteMap;
 
/**
 * 黑名单服务
 *
 * @author fangtengfei
 *
 */
public class BlackListServiceImpl {
 
    private static CopyOnWriteMap<String, Boolean> blackListMap = new CopyOnWriteMap<String, Boolean>(1000);
 
    public static boolean isBlackList(String id) {return blackListMap.get(id) == null ? false : true;
    }
 
    public static void addBlackList(String id) {blackListMap.put(id, Boolean.TRUE);
    }
 
    /**
     * 批量增加黑名单
     *
     * @param ids
     */
    public static void addBlackList(Map<String,Boolean> ids) {blackListMap.putAll(ids);
    }
 
}

代码很简略,然而应用 CopyOnWriteMap 须要留神两件事件:

  1. 缩小扩容开销。依据理论须要,初始化 CopyOnWriteMap 的大小,防止写时 CopyOnWriteMap 扩容的开销。
  2. 应用批量增加。因为每次增加,容器每次都会进行复制,所以缩小增加次数,能够缩小容器的复制次数。如应用下面代码里的 addBlackList 办法。

# CopyOnWrite 的毛病

CopyOnWrite 容器有很多长处,然而同时也存在两个问题,即内存占用问题和数据一致性问题。所以在开发的时候须要留神一下。

「内存占用问题」。因为 CopyOnWrite 的写时复制机制,所以在进行写操作的时候,内存里会同时驻扎两个对象的内存,旧的对象和新写入的对象(留神: 在复制的时候只是复制容器里的援用,只是在写的时候会创立新对象增加到新容器里,而旧容器的对象还在应用,所以有两份对象内存)。如果这些对象占用的内存比拟大,比如说 200M 左右,那么再写入 100M 数据进去,内存就会占用 300M,那么这个时候很有可能造成频繁的 Yong GC 和 Full GC。之前咱们零碎中应用了一个服务因为每晚应用 CopyOnWrite 机制更新大对象,造成了每晚 15 秒的 Full GC,利用响应工夫也随之变长。

「针对内存占用问题」,能够通过压缩容器中的元素的办法来缩小大对象的内存耗费,比方,如果元素全是 10 进制的数字,能够思考把它压缩成 36 进制或 64 进制。或者不应用 CopyOnWrite 容器,而应用其余的并发容器,如 ConcurrentHashMap。

「数据一致性问题」。CopyOnWrite 容器只能保证数据的最终一致性,不能保证数据的实时一致性。所以如果你心愿写入的的数据,马上能读到,请不要应用 CopyOnWrite 容器。

# CopyOnWriteArrayList 为什么并发平安且性能比 Vector 好

我晓得 Vector 是增删改查办法都加了 synchronized,保障同步,然而每个办法执行的时候都要去取得锁,性能就会大大降落,而 CopyOnWriteArrayList 只是在增删改上加锁,然而读不加锁,在读方面的性能就好于 Vector,CopyOnWriteArrayList 反对读多写少的并发状况。

链接:https://www.cnblogs.com/myseries/p/10877420.html

退出移动版