死磕-java集合之LinkedTransferQueue源码分析

55次阅读

共计 8967 个字符,预计需要花费 23 分钟才能阅读完成。

问题

(1)LinkedTransferQueue 是什么东东?

(2)LinkedTransferQueue 是怎么实现阻塞队列的?

(3)LinkedTransferQueue 是怎么控制并发安全的?

(4)LinkedTransferQueue 与 SynchronousQueue 有什么异同?

简介

LinkedTransferQueue 是 LinkedBlockingQueue、SynchronousQueue(公平模式)、ConcurrentLinkedQueue 三者的集合体,它综合了这三者的方法,并且提供了更加高效的实现方式。

继承体系

LinkedTransferQueue 实现了 TransferQueue 接口,而 TransferQueue 接口是继承自 BlockingQueue 的,所以 LinkedTransferQueue 也是一个阻塞队列。

TransferQueue 接口中定义了以下几个方法:

// 尝试移交元素
boolean tryTransfer(E e);
// 移交元素
void transfer(E e) throws InterruptedException;
// 尝试移交元素(有超时时间)boolean tryTransfer(E e, long timeout, TimeUnit unit)
    throws InterruptedException;
// 判断是否有消费者
boolean hasWaitingConsumer();
// 查看消费者的数量
int getWaitingConsumerCount();

主要是定义了三个移交元素的方法,有阻塞的,有不阻塞的,有超时的。

存储结构

LinkedTransferQueue 使用了一个叫做 dual data structure 的数据结构,或者叫做dual queue,译为双重数据结构或者双重队列。

双重队列是什么意思呢?

放取元素使用同一个队列,队列中的节点具有两种模式,一种是数据节点,一种是非数据节点。

放元素时先跟队列头节点对比,如果头节点是非数据节点,就让他们匹配,如果头节点是数据节点,就生成一个数据节点放在队列尾端(入队)。

取元素时也是先跟队列头节点对比,如果头节点是数据节点,就让他们匹配,如果头节点是非数据节点,就生成一个非数据节点放在队列尾端(入队)。

用图形来表示就是下面这样:

不管是放元素还是取元素,都先跟头节点对比,如果二者模式不一样就匹配它们,如果二者模式一样,就入队。

源码分析

主要属性

// 头节点
transient volatile Node head;
// 尾节点
private transient volatile Node tail;
// 放取元素的几种方式:// 立即返回,用于非超时的 poll()和 tryTransfer()方法中
private static final int NOW   = 0; // for untimed poll, tryTransfer
// 异步,不会阻塞,用于放元素时,因为内部使用无界单链表存储元素,不会阻塞放元素的过程
private static final int ASYNC = 1; // for offer, put, add
// 同步,调用的时候如果没有匹配到会阻塞直到匹配到为止
private static final int SYNC  = 2; // for transfer, take
// 超时,用于有超时的 poll()和 tryTransfer()方法中
private static final int TIMED = 3; // for timed poll, tryTransfer

主要内部类

static final class Node {
    // 是否是数据节点(也就标识了是生产者还是消费者)final boolean isData;   // false if this is a request node
    // 元素的值
    volatile Object item;   // initially non-null if isData; CASed to match
    // 下一个节点
    volatile Node next;
    // 持有元素的线程
    volatile Thread waiter; // null until waiting
}

典型的单链表结构,内部除了存储元素的值和下一个节点的指针外,还包含了是否为数据节点和持有元素的线程。

内部通过 isData 区分是生产者还是消费者。

主要构造方法

public LinkedTransferQueue() {}

public LinkedTransferQueue(Collection<? extends E> c) {this();
    addAll(c);
}

只有这两个构造方法,且没有初始容量,所以是无界的一个阻塞队列。

入队

四个方法都是一样的,使用异步的方式调用 xfer()方法,传入的参数都一模一样。

public void put(E e) {
    // 异步模式,不会阻塞,不会超时【本篇文章由公众号“彤哥读源码”原创】// 因为是放元素,单链表存储,会一直往后加
    xfer(e, true, ASYNC, 0);
}

public boolean offer(E e, long timeout, TimeUnit unit) {xfer(e, true, ASYNC, 0);
    return true;
}

public boolean offer(E e) {xfer(e, true, ASYNC, 0);
    return true;
}

public boolean add(E e) {xfer(e, true, ASYNC, 0);
    return true;
}

xfer(E e, boolean haveData, int how, long nanos)的参数分别是:

(1)e 表示元素;

(2)haveData 表示是否是数据节点,

(3)how 表示放取元素的方式,上面提到的四种,NOW、ASYNC、SYNC、TIMED;

(4)nanos 表示超时时间;

出队

出队的四个方法也是直接或间接的调用 xfer()方法,放取元素的方式和超时规则略微不同,本质没有大的区别。

public E remove() {E x = poll();
    if (x != null)
        return x;
    else
        throw new NoSuchElementException();}
public E take() throws InterruptedException {
    // 同步模式,会阻塞直到取到元素
    E e = xfer(null, false, SYNC, 0);
    if (e != null)
        return e;
    Thread.interrupted();
    throw new InterruptedException();}

public E poll(long timeout, TimeUnit unit) throws InterruptedException {
    // 有超时时间
    E e = xfer(null, false, TIMED, unit.toNanos(timeout));
    if (e != null || !Thread.interrupted())
        return e;
    throw new InterruptedException();}

public E poll() {
    // 立即返回,没取到元素返回 null
    return xfer(null, false, NOW, 0);
}

取元素就各有各的玩法了,有同步的,有超时的,有立即返回的。

移交元素的方法

public boolean tryTransfer(E e) {
    // 立即返回
    return xfer(e, true, NOW, 0) == null;
}

public void transfer(E e) throws InterruptedException {
    // 同步模式
    if (xfer(e, true, SYNC, 0) != null) {Thread.interrupted(); // failure possible only due to interrupt
        throw new InterruptedException();}
}

public boolean tryTransfer(E e, long timeout, TimeUnit unit)
    throws InterruptedException {
    // 有超时时间
    if (xfer(e, true, TIMED, unit.toNanos(timeout)) == null)
        return true;
    if (!Thread.interrupted())
        return false;
    throw new InterruptedException();}

请注意第二个参数,都是 true,也就是这三个方法其实也是放元素的方法。

这里 xfer()方法的几种模式到底有什么区别呢?请看下面的分析。

神奇的 xfer()方法

private E xfer(E e, boolean haveData, int how, long nanos) {
    // 不允许放入空元素【本篇文章由公众号“彤哥读源码”原创】if (haveData && (e == null))
        throw new NullPointerException();
    Node s = null;                        // the node to append, if needed
    // 外层循环,自旋,失败就重试
    retry:
    for (;;) {                            // restart on append race

        // 下面这个 for 循环用于控制匹配的过程
        // 同一时刻队列中只会存储一种类型的节点
        // 从头节点开始尝试匹配,如果头节点被其它线程先一步匹配了
        // 就再尝试其下一个,直到匹配到为止,或者到队列中没有元素为止
        
        for (Node h = head, p = h; p != null;) { // find & match first node
            // p 节点的模式
            boolean isData = p.isData;
            // p 节点的值
            Object item = p.item;
            // p 没有被匹配到
            if (item != p && (item != null) == isData) { // unmatched
                // 如果两者模式一样,则不能匹配,跳出循环后尝试入队
                if (isData == haveData)   // can't match
                    break;
                // 如果两者模式不一样,则尝试匹配
                // 把 p 的值设置为 e(如果是取元素则 e 是 null,如果是放元素则 e 是元素值)if (p.casItem(item, e)) { // match
                    // 匹配成功
                    // for 里面的逻辑比较复杂,用于控制多线程同时放取元素时出现竞争的情况的
                    // 看不懂可以直接跳过
                    for (Node q = p; q != h;) {
                        // 进入到这里可能是头节点已经被匹配,然后 p 会变成 h 的下一个节点 
                        Node n = q.next;  // update by 2 unless singleton
                        // 如果 head 还没变,就把它更新成新的节点
                        // 并把它删除(forgetNext()会把它的 next 设为自己,也就是从单链表中删除了)// 这时为什么要把 head 设为 n 呢?因为到这里了,肯定 head 本身已经被匹配掉了
                        // 而上面的 p.casItem()又成功了,说明 p 也被当前这个元素给匹配掉了
                        // 所以需要把它们俩都出队列,让其它线程可以从真正的头开始,不用重复检查了
                        if (head == h && casHead(h, n == null ? q : n)) {h.forgetNext();
                            break;
                        }                 // advance and retry
                        // 如果新的头节点为空,或者其 next 为空,或者其 next 未匹配,就重试
                        if ((h = head)   == null ||
                            (q = h.next) == null || !q.isMatched())
                            break;        // unless slack < 2
                    }
                    // 唤醒 p 中等待的线程
                    LockSupport.unpark(p.waiter);
                    // 并返回匹配到的元素
                    return LinkedTransferQueue.<E>cast(item);
                }
            }
            // p 已经被匹配了或者尝试匹配的时候失败了
            // 也就是其它线程先一步匹配了 p
            // 这时候又分两种情况,p 的 next 还没来得及修改,p 的 next 指向了自己
            // 如果 p 的 next 已经指向了自己,就重新取 head 重试,否则就取其 next 重试
            Node n = p.next;
            p = (p != n) ? n : (h = head); // Use head if p offlist
        }

        // 到这里肯定是队列中存储的节点类型和自己一样
        // 或者队列中没有元素了
        // 就入队(不管放元素还是取元素都得入队)// 入队又分成四种情况:// NOW,立即返回,没有匹配到立即返回,不做入队操作
        // ASYNC,异步,元素入队但当前线程不会阻塞(相当于无界 LinkedBlockingQueue 的元素入队)// SYNC,同步,元素入队后当前线程阻塞,等待被匹配到
        // TIMED,有超时,元素入队后等待一段时间被匹配,时间到了还没匹配到就返回元素本身

        // 如果不是立即返回
        if (how != NOW) {                 // No matches available
            // 新建 s 节点
            if (s == null)
                s = new Node(e, haveData);
            // 尝试入队
            Node pred = tryAppend(s, haveData);
            // 入队失败,重试
            if (pred == null)
                continue retry;           // lost race vs opposite mode
            // 如果不是异步(同步或者有超时)// 就等待被匹配
            if (how != ASYNC)
                return awaitMatch(s, pred, e, (how == TIMED), nanos);
        }
        return e; // not waiting
    }
}

private Node tryAppend(Node s, boolean haveData) {
    // 从 tail 开始遍历,把 s 放到链表尾端
    for (Node t = tail, p = t;;) {        // move p to last node and append
        Node n, u;                        // temps for reads of next & tail
        // 如果首尾都是 null,说明链表中还没有元素
        if (p == null && (p = head) == null) {
            // 就让首节点指向 s
            // 注意,这里插入第一个元素的时候 tail 指针并没有指向 s
            if (casHead(null, s))
                return s;                 // initialize
        }
        else if (p.cannotPrecede(haveData))
            // 如果 p 无法处理,则返回 null
            // 这里无法处理的意思是,p 和 s 节点的类型不一样,不允许 s 入队
            // 比如,其它线程先入队了一个数据节点,这时候要入队一个非数据节点,就不允许,// 队列中所有的元素都要保证是同一种类型的节点
            // 返回 null 后外面的方法会重新尝试匹配重新入队等
            return null;                  // lost race vs opposite mode
        else if ((n = p.next) != null)    // not last; keep traversing
            // 如果 p 的 next 不为空,说明不是最后一个节点
            // 则让 p 重新指向最后一个节点
            p = p != t && t != (u = tail) ? (t = u) : // stale tail
                (p != n) ? n : null;      // restart if off list
        else if (!p.casNext(null, s))
            // 如果 CAS 更新 s 为 p 的 next 失败
            // 则说明有其它线程先一步更新到 p 的 next 了
            // 就让 p 指向 p 的 next,重新尝试让 s 入队
            p = p.next;                   // re-read on CAS failure
        else {
            // 到这里说明 s 成功入队了
            // 如果 p 不等于 t,就更新 tail 指针
            // 还记得上面插入第一个元素时 tail 指针并没有指向新元素吗?// 这里就是用来更新 tail 指针的
            if (p != t) {                 // update if slack now >= 2
                while ((tail != t || !casTail(t, s)) &&
                       (t = tail)   != null &&
                       (s = t.next) != null && // advance and retry
                       (s = s.next) != null && s != t);
            }
            // 返回 p,即 s 的前一个元素
            return p;
        }
    }
}

private E awaitMatch(Node s, Node pred, E e, boolean timed, long nanos) {
    // 如果是有超时的,计算其超时时间
    final long deadline = timed ? System.nanoTime() + nanos : 0L;
    // 当前线程
    Thread w = Thread.currentThread();
    // 自旋次数
    int spins = -1; // initialized after first item and cancel checks
    // 随机数,随机让一些自旋的线程让出 CPU
    ThreadLocalRandom randomYields = null; // bound if needed

    for (;;) {
        Object item = s.item;
        // 如果 s 元素的值不等于 e,说明它被匹配到了
        if (item != e) {                  // matched
            // assert item != s;
            // 把 s 的 item 更新为 s 本身
            // 并把 s 中的 waiter 置为空
            s.forgetContents();           // avoid garbage
            // 返回匹配到的元素
            return LinkedTransferQueue.<E>cast(item);
        }
        // 如果当前线程中断了,或者有超时的到期了
        // 就更新 s 的元素值指向 s 本身
        if ((w.isInterrupted() || (timed && nanos <= 0)) &&
                s.casItem(e, s)) {        // cancel
            // 尝试解除 s 与其前一个节点的关系
            // 也就是删除 s 节点
            unsplice(pred, s);
            // 返回元素的值本身,说明没匹配到
            return e;
        }
        
        // 如果自旋次数小于 0,就计算自旋次数
        if (spins < 0) {                  // establish spins at/near front
            // spinsFor()计算自旋次数
            // 如果前面有节点未被匹配就返回 0
            // 如果前面有节点且正在匹配中就返回一定的次数,等待
            if ((spins = spinsFor(pred, s.isData)) > 0)
                // 初始化随机数
                randomYields = ThreadLocalRandom.current();}
        else if (spins > 0) {             // spin
            // 还有自旋次数就减 1
            --spins;
            // 并随机让出 CPU
            if (randomYields.nextInt(CHAINED_SPINS) == 0)
                Thread.yield();           // occasionally yield}
        else if (s.waiter == null) {
            // 更新 s 的 waiter 为当前线程
            s.waiter = w;                 // request unpark then recheck
        }
        else if (timed) {
            // 如果有超时,计算超时时间,并阻塞一定时间
            nanos = deadline - System.nanoTime();
            if (nanos > 0L)
                LockSupport.parkNanos(this, nanos);
        }
        else {
            // 不是超时的,直接阻塞,等待被唤醒
            // 唤醒后进入下一次循环,走第一个 if 的逻辑就返回匹配的元素了
            LockSupport.park(this);
        }
    }
}

这三个方法里的内容特别复杂,很大一部分代码都是在控制线程安全,各种 CAS,我们这里简单描述一下大致的逻辑:

(1)来了一个元素,我们先查看队列头的节点,是否与这个元素的模式一样;

(2)如果模式不一样,就尝试让他们匹配,如果头节点被别的线程先匹配走了,就尝试与头节点的下一个节点匹配,如此一直往后,直到匹配到或到链表尾为止;

(3)如果模式一样,或者到链表尾了,就尝试入队【本篇文章由公众号“彤哥读源码”原创】;

(4)入队的时候有可能链表尾修改了,那就尾指针后移,再重新尝试入队,依此往复;

(5)入队成功了,就自旋或阻塞,阻塞了就等待被其它线程匹配到并唤醒;

(6)唤醒之后进入下一次循环就匹配到元素了,返回匹配到的元素;

(7)是否需要入队及阻塞有四种情况:

a)NOW,立即返回,没有匹配到立即返回,不做入队操作

    对应的方法有:poll()、tryTransfer(e)

b)ASYNC,异步,元素入队但当前线程不会阻塞(相当于无界 LinkedBlockingQueue 的元素入队)对应的方法有:add(e)、offer(e)、put(e)、offer(e, timeout, unit)

c)SYNC,同步,元素入队后当前线程阻塞,等待被匹配到

    对应的方法有:take()、transfer(e)

d)TIMED,有超时,元素入队后等待一段时间被匹配,时间到了还没匹配到就返回元素本身

    对应的方法有:poll(timeout, unit)、tryTransfer(e, timeout, unit)

总结

(1)LinkedTransferQueue 可以看作 LinkedBlockingQueue、SynchronousQueue(公平模式)、ConcurrentLinkedQueue 三者的集合体;

(2)LinkedTransferQueue 的实现方式是使用一种叫做 双重队列 的数据结构;

(3)不管是取元素还是放元素都会入队;

(4)先尝试跟头节点比较,如果二者模式不一样,就匹配它们,组成 CP,然后返回对方的值;

(5)如果二者模式一样,就入队,并自旋或阻塞等待被唤醒;

(6)至于是否入队及阻塞有四种模式,NOW、ASYNC、SYNC、TIMED;

(7)LinkedTransferQueue 全程都没有使用 synchronized、重入锁等比较重的锁,基本是通过 自旋 +CAS 实现;

(8)对于入队之后,先自旋一定次数后再调用 LockSupport.park()或 LockSupport.parkNanos 阻塞;

彩蛋

LinkedTransferQueue 与 SynchronousQueue(公平模式)有什么异同呢?

(1)在 java8 中两者的实现方式基本一致,都是使用的双重队列;

(2)前者完全实现了后者,但比后者更灵活;

(3)后者不管放元素还是取元素,如果没有可匹配的元素,所在的线程都会阻塞;

(4)前者可以自己控制放元素是否需要阻塞线程,比如使用四个添加元素的方法就不会阻塞线程,只入队元素,使用 transfer()会阻塞线程;

(5)取元素两者基本一样,都会阻塞等待有新的元素进入被匹配到;


欢迎关注我的公众号“彤哥读源码”,查看更多源码系列文章, 与彤哥一起畅游源码的海洋。

正文完
 0