乐趣区

死磕-java线程系列之线程池深入解析生命周期

(手机横屏看源码更方便)


注:java 源码分析部分如无特殊说明均基于 java8 版本。

注:线程池源码部分如无特殊说明均指 ThreadPoolExecutor 类。

简介

上一章我们一起重温了下线程的生命周期(六种状态还记得不?),但是你知不知道其实线程池也是有生命周期的呢?!

问题

(1)线程池的状态有哪些?

(2)各种状态下对于任务队列中的任务有何影响?

先上源码

其实,在我们讲线程池体系结构的时候,讲了一些方法,比如 shutDown()/shutDownNow(),它们都是与线程池的生命周期相关联的。

我们先来看一下线程池 ThreadPoolExecutor 中定义的生命周期中的状态及相关方法:

private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING, 0));
private static final int COUNT_BITS = Integer.SIZE - 3; // =29
private static final int CAPACITY   = (1 << COUNT_BITS) - 1; // =000 11111...

// runState is stored in the high-order bits
private static final int RUNNING    = -1 << COUNT_BITS; // 111 00000...
private static final int SHUTDOWN   =  0 << COUNT_BITS; // 000 00000...
private static final int STOP       =  1 << COUNT_BITS; // 001 00000...
private static final int TIDYING    =  2 << COUNT_BITS; // 010 00000...
private static final int TERMINATED =  3 << COUNT_BITS; // 011 00000...

// 线程池的状态
private static int runStateOf(int c)     {return c & ~CAPACITY;}
// 线程池中工作线程的数量
private static int workerCountOf(int c)  {return c & CAPACITY;}
// 计算 ctl 的值,等于运行状态“加上”线程数量
private static int ctlOf(int rs, int wc) {return rs | wc;}

从上面这段代码,我们可以得出:

(1)线程池的状态和工作线程的数量共同保存在控制变量 ctl 中,类似于 AQS 中的 state 变量,不过这里是直接使用的 AtomicInteger,这里换成 unsafe+volatile 也是可以的;

(2)ctl 的高三位保存运行状态,低 29 位保存工作线程的数量,也就是说线程的数量最多只能有 (2^29-1) 个,也就是上面的 CAPACITY;

(3)线程池的状态一共有五种,分别是 RUNNING、SHUTDOWN、STOP、TIDYING、TERMINATED;

(4)RUNNING,表示可接受新任务,且可执行队列中的任务;

(5)SHUTDOWN,表示不接受新任务,但可执行队列中的任务;

(6)STOP,表示不接受新任务,且不再执行队列中的任务,且中断正在执行的任务;

(7)TIDYING,所有任务已经中止,且工作线程数量为 0,最后变迁到这个状态的线程将要执行 terminated()钩子方法,只会有一个线程执行这个方法;

(8)TERMINATED,中止状态,已经执行完 terminated()钩子方法;

流程图

下面我们再来看看这些状态之间是怎么流转的:

(1)新建线程池时,它的初始状态为 RUNNING,这个在上面定义 ctl 的时候可以看到;

(2)RUNNING->SHUTDOWN,执行 shutdown()方法时;

(3)RUNNING->STOP,执行 shutdownNow()方法时;

(4)SHUTDOWN->STOP,执行 shutdownNow()方法时【本文由公从号“彤哥读源码”原创】;

(5)STOP->TIDYING,执行了 shutdown()或者 shutdownNow()后,所有任务已中止,且工作线程数量为 0 时,此时会执行 terminated()方法;

(6)TIDYING->TERMINATED,执行完 terminated()方法后;

源码分析

你以为贴个状态的源码,画个图就结束了嘛?那肯定不能啊,下面让我们一起来看看源码中是怎么控制的。

(1)RUNNING

RUNNING,比较简单,创建线程池的时候就会初始化 ctl,而 ctl 初始化为 RUNNING 状态,所以线程池的初始状态就为 RUNNING 状态。

// 初始状态为 RUNNING
private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING, 0));

(2)SHUTDOWN

执行 shutdown()方法时把状态修改为 SHUTDOWN,这里肯定会成功,因为 advanceRunState()方法中是个自旋,不成功不会退出。

public void shutdown() {
    final ReentrantLock mainLock = this.mainLock;
    mainLock.lock();
    try {checkShutdownAccess();
        // 修改状态为 SHUTDOWN
        advanceRunState(SHUTDOWN);
        // 标记空闲线程为中断状态
        interruptIdleWorkers();
        onShutdown();} finally {mainLock.unlock();
    }
    tryTerminate();}
private void advanceRunState(int targetState) {for (;;) {int c = ctl.get();
        // 如果状态大于 SHUTDOWN,或者修改为 SHUTDOWN 成功了,才会 break 跳出自旋
        if (runStateAtLeast(c, targetState) ||
            ctl.compareAndSet(c, ctlOf(targetState, workerCountOf(c))))
            break;
    }
}

(3)STOP

执行 shutdownNow()方法时,会把线程池状态修改为 STOP 状态,同时标记所有线程为中断状态。

public List<Runnable> shutdownNow() {
    List<Runnable> tasks;
    final ReentrantLock mainLock = this.mainLock;
    mainLock.lock();
    try {checkShutdownAccess();
        // 修改为 STOP 状态
        advanceRunState(STOP);
        // 标记所有线程为中断状态
        interruptWorkers();
        tasks = drainQueue();} finally {
        //【本文由公从号“彤哥读源码”原创】mainLock.unlock();}
    tryTerminate();
    return tasks;
}

至于线程是否响应中断其实是在队列的 take()或 poll()方法中响应的,最后会到 AQS 中,它们检测到线程中断了会抛出一个 InterruptedException 异常,然后 getTask()中捕获这个异常,并且在下一次的自旋时退出当前线程并减少工作线程的数量。

private Runnable getTask() {boolean timedOut = false; // Did the last poll() time out?

    for (;;) {int c = ctl.get();
        int rs = runStateOf(c);

        // 如果状态为 STOP 了,这里会直接退出循环,且减少工作线程数量
        // 退出循环了也就相当于这个线程的生命周期结束了
        if (rs >= SHUTDOWN && (rs >= STOP || workQueue.isEmpty())) {decrementWorkerCount();
            return null;
        }

        int wc = workerCountOf(c);

        // Are workers subject to culling?
        boolean timed = allowCoreThreadTimeOut || wc > corePoolSize;

        if ((wc > maximumPoolSize || (timed && timedOut))
            && (wc > 1 || workQueue.isEmpty())) {if (compareAndDecrementWorkerCount(c))
                return null;
            continue;
        }

        try {// 真正响应中断是在 poll()方法或者 take()方法中
            Runnable r = timed ?
                workQueue.poll(keepAliveTime, TimeUnit.NANOSECONDS) :
                workQueue.take();
            if (r != null)
                return r;
            timedOut = true;
        } catch (InterruptedException retry) {
            // 这里捕获中断异常
            timedOut = false;
        }
    }
}

这里有一个问题,就是已经通过 getTask()取出来且返回的任务怎么办?

实际上它们会正常执行完毕,有兴趣的同学可以自己看看 runWorker()这个方法,我们下一节会分析这个方法。

(4)TIDYING

当执行 shutdown()或 shutdownNow()之后,如果所有任务已中止,且工作线程数量为 0,就会进入这个状态。

final void tryTerminate() {for (;;) {int c = ctl.get();
        // 下面几种情况不会执行后续代码
        // 1. 运行中
        // 2. 状态的值比 TIDYING 还大,也就是 TERMINATED
        // 3. SHUTDOWN 状态且任务队列不为空
        if (isRunning(c) ||
            runStateAtLeast(c, TIDYING) ||
            (runStateOf(c) == SHUTDOWN && ! workQueue.isEmpty()))
            return;
        // 工作线程数量不为 0,也不会执行后续代码
        if (workerCountOf(c) != 0) {
            // 尝试中断空闲的线程
            interruptIdleWorkers(ONLY_ONE);
            return;
        }

        final ReentrantLock mainLock = this.mainLock;
        mainLock.lock();
        try {
            // CAS 修改状态为 TIDYING 状态
            if (ctl.compareAndSet(c, ctlOf(TIDYING, 0))) {
                try {
                    // 更新成功,执行 terminated 钩子方法
                    terminated();} finally {
                    // 强制更新状态为 TERMINATED,这里不需要 CAS 了
                    ctl.set(ctlOf(TERMINATED, 0));
                    termination.signalAll();}
                return;
            }
        } finally {mainLock.unlock();
        }
        // else retry on failed CAS
    }
}

实际更新状态为 TIDYING 和 TERMINATED 状态的代码都在 tryTerminate()方法中,实际上 tryTerminated()方法在很多地方都有调用,比如 shutdown()、shutdownNow()、线程退出时,所以说几乎每个线程最后消亡的时候都会调用 tryTerminate()方法,但最后只会有一个线程真正执行到修改状态为 TIDYING 的地方。

修改状态为 TIDYING 后执行 terminated()方法,最后修改状态为 TERMINATED,标志着线程池真正消亡了。

(5)TERMINATED

见 TIDYING 中分析。

彩蛋

本章我们一起从状态定义、流程图、源码分析等多个角度一起学习了线程池的生命周期,你掌握的怎么样呢?

下一章我们将开始学习线程池执行任务的主流程,对这一块内容感到恐惧的同学可以先看看彤哥之前写的“手写线程池”的两篇文章,对接下来学习线程池的主要流程非常有好处。


欢迎关注我的公众号“彤哥读源码”,查看更多源码系列文章, 与彤哥一起畅游源码的海洋。

退出移动版