深入分析Condition的await和signal原理

共计 6142 个字符，预计需要花费 16 分钟才能阅读完成。

作者：张文俊，转载请注明出处。

任何一个 java 对象都天然继承于 Object 类，在线程间实现通信往往会应用到 Object 的几个方法，比如 wait(),wait(long timeout),wait(long timeout, int nanos)与 notify(),notifyAll()几个方法实现等待 / 通知机制，同样的，在 java Lock 体系下依然会有同样的方法实现等待 / 通知机制。

wait(),notify(), 与 await()和 signal 的区别：

前者是配合内置锁 synchronized 来实现多个线程间的通知的，后者一般结合 Lock 来实现前者的功能，不同的是 synchronized 同时 只能与一个共享变量的 notify 或 wait 方法实现同步，而 AQS 的一个锁可以对应多个条件变量。

1、signal()：唤醒一个等待在 condition 上的线程，将该线程从 条件队列 中转移到 同步队列（AQS 阻塞队列）中，如果在同步队列中能够竞争到 Lock 则可以从等待方法中返回

2、signalAll()：能够唤醒所有等待在 condition 上的线程

要想能够深入的掌握 condition 还是应该知道它的实现原理，现在我们一起来看看 condiiton 的源码。创建一个 condition 对象是通过 lock.newCondition(), 而这个方法实际上是会 new 出一个ConditionObject 对象，该类是 AQS 的一个内部类，可以访问到 AQS 的变量和方法。condition 内部维护了一个 等待队列，所有调 condition.await 方法的线程会加入到等待队列中，并且线程状态转换为等待状态。另外注意到 ConditionObject 中有两个成员变量：

private transient Node firstWaiter;
private transient Node lastWaiter;

这样我们就可以看出来 ConditionObject 通过持有等待队列的头尾指针来管理等待队列。主要注意的是 Node 类复用了在 AQS 中的 Node 类，进一步说明，等待队列是一个单向队列，而 AQS 同步队列是一个双端队列。

同时还有一点需要注意的是：我们可以多次调用 lock.newCondition()方法创建多个 condition 对象，也就是一个 lock 可以持有多个等待队列。而在之前利用 Object 的方式实际上是指在 对象 Object 对象监视器上只能拥有一个同步队列和一个等待队列，而并发包中的 Lock 拥有一个同步队列和多个等待队列。示意图如下：

ConditionObject 是 AQS 的内部类，因此每个 ConditionObject 能够访问到 AQS 提供的方法，相当于每个 Condition 都拥有所属同步器的引用

当调用 condition.await()方法后会使得当前获取 lock 的线程进入到等待队列，如果该线程能够从 await()方法返回的话一定是该线程获取了与 condition 相关联的 lock。接下来，我们就从几个核心方法的代码说起，首先从 await()方法开始。await()方法源码为：

public final void await() throws InterruptedException {if (Thread.interrupted())
        throw new InterruptedException();
    // 1. 将当前线程包装成 Node，尾插入到等待队列中
    Node node = addConditionWaiter();
    // 2. 释放当前线程所占用的 lock，在释放的过程中会唤醒同步队列中的下一个节点
    int savedState = fullyRelease(node);
    int interruptMode = 0;
    while (!isOnSyncQueue(node)) {
        // 3. 当前线程进入到等待状态
        LockSupport.park(this);
        if ((interruptMode = checkInterruptWhileWaiting(node)) != 0)
            break;
    }
    // 4. 自旋等待获取到同步状态（即获取到 lock）if (acquireQueued(node, savedState) && interruptMode != THROW_IE)
        interruptMode = REINTERRUPT;
    if (node.nextWaiter != null) // clean up if cancelled
        unlinkCancelledWaiters();
    // 5. 处理被中断的情况
    if (interruptMode != 0)
        reportInterruptAfterWait(interruptMode);
}

当前线程调用 condition.await()方法后，会使得当前线程释放 lock 然后加入到等待队列中，直至被 signal/signalAll 后会使得当前线程从等待队列中移至到同步队列中去，直到获得了 lock 后才会从 await 方法返回，或者在等待时被中断会做中断处理。那么关于这个实现过程我们会有这样几个问题：

是怎样将当前线程添加到等待队列中去的？
释放锁的过程？
怎样才能从 await 方法退出？

而这段代码的逻辑就是告诉我们这三个问题的答案。具体 请看注释，在第 1 步中调用 addConditionWaiter 将当前线程添加到等待队列中，该方法源码为：

private Node addConditionWaiter() {
    Node t = lastWaiter;
    // If lastWaiter is cancelled, clean out.
    if (t != null && t.waitStatus != Node.CONDITION) {unlinkCancelledWaiters();
        t = lastWaiter;
    }
    // 将当前线程包装成 Node
    Node node = new Node(Thread.currentThread(), Node.CONDITION);
    if (t == null)
        firstWaiter = node;
    else
        // 尾插入
        t.nextWaiter = node;
    // 更新 lastWaiter
    lastWaiter = node;
    return node;
}

将当前节点包装成 Node，如果等待队列的 firstWaiter 为 null 的话（等待队列为空队列），则将 firstWaiter 指向当前的 Node, 否则，更新 lastWaiter(尾节点)即可。就是 通过尾插入的方式将当前线程封装的 Node 插入到等待队列中即可 ，同时可以看出等待队列是一个 不带头结点的链式队列 ，之前我们学习 AQS 时知道同步队列 是一个带头结点的链式队列，这是两者的一个区别。将当前节点插入到等待对列之后，会使当前线程释放 lock，由 fullyRelease 方法实现，fullyRelease 源码为：

final int fullyRelease(Node node) {
    boolean failed = true;
    try {int savedState = getState();
        if (release(savedState)) {
            // 成功释放同步状态
            failed = false;
            return savedState;
        } else {
            // 不成功释放同步状态抛出异常
            throw new IllegalMonitorStateException();}
    } finally {if (failed)
            node.waitStatus = Node.CANCELLED;
    }
}

调用 AQS 的模板方法 release 方法释放 AQS 的同步状态并且唤醒在同步队列中头结点的后继节点引用的线程，如果释放成功则正常返回，若失败的话就抛出异常。到目前为止，这两段代码已经解决了前面的两个问题的答案了，还剩下第三个问题，怎样从 await 方法退出？现在回过头再来看 await 方法有这样一段逻辑：

while (!isOnSyncQueue(node)) {
    // 3. 当前线程进入到等待状态
    LockSupport.park(this);
    if ((interruptMode = checkInterruptWhileWaiting(node)) != 0)
        break;
}

很显然，当线程第一次调用 condition.await()方法时，会进入到这个 while()循环中，然后通过 LockSupport.park(this)方法使得当前线程进入等待状态，那么要想退出这个 await 方法第一个前提条件自然而然的是要先退出这个 while 循环，出口就只剩下两个地方：1. 逻辑走到 break 退出 while 循环；2. while 循环中的逻辑判断为 false。

再看代码出现第 1 种情况的条件是当前等待的线程被中断后代码会走到 break 退出，第二种情况是当前节点被移动到了同步队列中（即另外线程调用的 condition 的 signal 或者 signalAll 方法），while 中逻辑判断为 false 后结束 while 循环。总结下，就是 当前线程被中断或者调用 condition.signal/condition.signalAll 方法当前节点移动到了同步队列后 ，这是当前线程退出 await 方法的前提条件。当退出 while 循环后就会调用acquireQueued(node, savedState) 该方法的作用是在 自旋过程中线程不断尝试获取同步状态，直至成功（线程获取到 lock）。这样也说明了 退出 await 方法必须是已经获得了 condition 引用（关联）的 lock。

到目前为止，开头的三个问题我们通过阅读源码的方式已经完全找到了答案，也对 await 方法的理解加深。await 方法示意图如下图：

如图，调用 condition.await 方法的线程必须是已经获得了 lock，也就是当前线程是同步队列中的头结点。调用该方法后会使得当前线程所封装的 Node 尾插入到等待队列中。

1、condition 还额外支持了超时机制，使用者可调用方法 awaitNanos,awaitUtil

2、不响应中断的支持，condition.awaitUninterruptibly()方法

调用 condition 的 signal 或者 signalAll 方法可以将等待队列中等待时间最长的节点移动到同步队列中，使得该节点能够有机会获得 lock。按照等待队列是先进先出（FIFO）的，所以等待队列的头节点必然会是等待时间最长的节点，也就是每次调用 condition 的 signal 方法是将头节点移动到同步队列中。我们来通过看源码的方式来看这样的猜想是不是对的，signal 方法源码为：

public final void signal() {
    //1. 先检测当前线程是否已经获取 lock
    if (!isHeldExclusively())
        throw new IllegalMonitorStateException();
    //2. 获取等待队列中第一个节点，之后的操作都是针对这个节点
    Node first = firstWaiter;
    if (first != null)
        doSignal(first);
}

signal 方法首先会检测当前线程是否已经获取 lock，如果没有获取 lock 会直接抛出异常，如果获取的话再得到等待队列的头指针引用的节点，之后的操作的 doSignal 方法也是基于该节点。下面我们来看看 doSignal 方法做了些什么事情，doSignal 方法源码为：

private void doSignal(Node first) {
    do {if ( (firstWaiter = first.nextWaiter) == null)
            lastWaiter = null;
        //1. 将头结点从等待队列中移除
        first.nextWaiter = null;
        //2. while 中 transferForSignal 方法对头结点做真正的处理
    } while (!transferForSignal(first) &&
             (first = firstWaiter) != null);
}

具体逻辑请看注释，真正对头节点做处理的逻辑在 transferForSignal 放，该方法源码为：

final boolean transferForSignal(Node node) {
   
    //1. 更新状态为 0
    if (!compareAndSetWaitStatus(node, Node.CONDITION, 0))
        return false;
    //2. 将该节点移入到同步队列中去
    Node p = enq(node);
    int ws = p.waitStatus;
    if (ws > 0 || !compareAndSetWaitStatus(p, ws, Node.SIGNAL))
        LockSupport.unpark(node.thread);
    return true;
}

关键逻辑请看注释，这段代码主要做了两件事情 1. 将头结点的状态更改为 CONDITION；2. 调用 enq 方法，将该节点尾插入到同步队列中，关于 enq 方法请看 AQS 的底层实现这篇文章。现在我们可以得出结论：调用 condition 的 signal 的前提条件是当前线程已经获取了 lock，该方法会使得等待队列中的头节点即等待时间最长的那个节点移入到同步队列，而移入到同步队列后才有机会使得等待线程被唤醒，即从 await 方法中的 LockSupport.park(this)方法中返回，从而才有机会使得调用 await 方法的线程成功退出。signal 执行示意图如下图：

sigllAll 与 sigal 方法的区别体现在 doSignalAll 方法上，前面我们已经知道 d oSignal 方法只会对等待队列的头节点进行操作，，而 doSignalAll 的源码为：

private void doSignalAll(Node first) {
    lastWaiter = firstWaiter = null;
    do {
        Node next = first.nextWaiter;
        first.nextWaiter = null;
        transferForSignal(first);
        first = next;
    } while (first != null);
}

该方法只不过时间等待队列中的每一个节点都移入到同步队列中，即“通知”当前调用 condition.await()方法的每一个线程

如图，线程 awaitThread 先通过 lock.lock()方法获取锁成功后调用了 condition.await 方法进入等待队列，而另一个线程 signalThread 通过 lock.lock()方法获取锁成功后调用了 condition.signal 或者 signalAll 方法，使得线程 awaitThread 能够有机会移入到同步队列中，当其他线程释放 lock 后使得线程 awaitThread 能够有机会获取 lock，从而使得线程 awaitThread 能够从 await 方法中退出执行后续操作。如果 awaitThread 获取 lock 失败会直接进入到同步队列。

公众号简介：作者是蚂蚁金服的一线开发，分享自己的成长和思考之路。内容涉及数据、研发、算法。

1.Condition 简介

2.Condition 实现原理分析

2.1 等待队列

2.2 await 实现原理

2.3 signal/signalAll 实现原理

3.await 与 signal/signalAll 的结合思考

Just My Socks（注册教程内含优惠码）