关于多线程:图文并茂带你搞懂多线程和多进程

38次阅读

共计 5113 个字符,预计需要花费 13 分钟才能阅读完成。

什么是线程

什么是线程?线程与过程与有什么关系?这是一个十分形象的问题,也是一个特地广的话题,波及到十分多的常识。我不能确保能把它讲的话,也不能确保讲的内容全副都正确。即便这样,我也心愿尽可能地把他讲艰深一点,讲的明确一点,因为这是个始终困扰我很久的,错综复杂的常识畛域,心愿通过我的了解揭开它一层一层神秘的面纱。

任务调度

线程是什么?要了解这个概念,须要先理解一下操作系统的一些相干概念。

大部分操作系统 (如 Windows、Linux) 的任务调度是采纳工夫片轮转的抢占式调度形式,也就是说一个工作执行一小段时间后强制暂停去执行下一个工作,每个工作轮流执行。工作执行的一小段时间叫做工夫片,工作正在执行时的状态叫运行状态,工作执行一段时间后强制暂停去执行下一个工作,被暂停的工作就处于就绪状态期待下一个属于它的工夫片的到来。

这样每个工作都能失去执行,因为 CPU 的执行效率十分高,工夫片十分短,在各个工作之间疾速地切换,给人的感觉就是多个工作在“同时进行”,这也就是咱们所说的并发(别感觉并发有多浅近,它的实现很简单,但它的概念很简略,就是一句话:多个工作同时执行)。多任务运行过程的示意图如下:

图 1:操作系统中的任务调度

过程

咱们都晓得计算机的外围是 CPU,它承当了所有的计算工作;而操作系统是计算机的管理者,它负责工作的调度、资源的调配和治理,统领整个计算机硬件;应用程序侧是具备某种性能的程序,程序是运行于操作系统之上的。

过程是一个具备肯定独立性能的程序在一个数据集上的一次动静执行的过程,是操作系统进行资源分配和调度的一个独立单位,是利用程序运行的载体。

过程是一种形象的概念,素来没有对立的规范定义。过程个别由程序、数据汇合和过程管制块三局部组成。

程序用于形容过程要实现的性能,是管制过程执行的指令集;数据汇合是程序在执行时所须要的数据和工作区;程序控制块(Program Control Block,简称 PCB),蕴含过程的形容信息和管制信息,是过程存在的惟一标记。

过程具备的特色:

动态性:过程是程序的一次执行过程,是长期的,有生命期的,是动静产生,动静沦亡的;

并发性:任何过程都能够同其余过程一起并发执行;

独立性:过程是零碎进行资源分配和调度的一个独立单位;

结构性:过程由程序、数据和过程管制块三局部组成。

线程

在晚期的操作系统中并没有线程的概念,过程是能领有资源和独立运行的最小单位,也是程序执行的最小单位。

任务调度采纳的是工夫片轮转的抢占式调度形式,而过程是任务调度的最小单位,每个过程有各自独立的一块内存,使得各个过程之间内存地址互相隔离。

起初,随着计算机的倒退,对 CPU 的要求越来越高,过程之间的切换开销较大,曾经无奈满足越来越简单的程序的要求了。于是就创造了线程,线程是程序执行中一个繁多的顺序控制流程,是程序执行流的最小单元,是处理器调度和分派的根本单位。

一个过程能够有一个或多个线程,各个线程之间共享程序的内存空间 (也就是所在过程的内存空间)。一个规范的线程由线程 ID、以后指令指针(PC)、寄存器和堆栈组成。而过程由内存空间(代码、数据、过程空间、关上的文件) 和一个或多个线程组成。

过程与线程的区别

后面讲了过程与线程,但可能你还感觉迷糊,感觉他们很相似。确实,过程与线程有着千头万绪的关系,上面就让咱们一起来理一理:

1. 线程是程序执行的最小单位,而过程是操作系统分配资源的最小单位;

2. 一个过程由一个或多个线程组成,线程是一个过程中代码的不同执行路线;

3. 过程之间互相独立,但同一过程下的各个线程之间共享程序的内存空间 (包含代码段、数据集、堆等) 及一些过程级的资源(如关上文件和信号),某过程内的线程在其它过程不可见;

4. 调度和切换:线程上下文切换比过程上下文切换要快得多。

线程与过程关系的示意图:

图 2:过程与线程的资源共享关系 

图 3:单线程与多线程的关系

总之,线程和过程都是一种形象的概念,线程是一种比过程更小的形象,线程和过程都可用于实现并发。

在晚期的操作系统中并没有线程的概念,过程是能领有资源和独立运行的最小单位,也是程序执行的最小单位。它相当于一个过程里只有一个线程,过程自身就是线程。

所以线程有时被称为轻量级过程(Lightweight Process,LWP)。

图 4:晚期的操作系统只有过程,没有线程

起初,随着计算机的倒退,对多个工作之间上下文切换的效率要求越来越高,就形象出一个更小的概念——线程,个别一个过程会有多个 (也可是一个) 线程。

图 5:线程的呈现,使得一个过程能够有多个线程

多线程与多核

下面提到的工夫片轮转的调度形式说一个工作执行一小段时间后强制暂停去执行下一个工作,每个工作轮流执行。很多操作系统的书都说“同一时间点只有一个工作在执行”。那有人可能就要问双核处理器呢?难道两个核不是同时运行吗?

其实“同一时间点只有一个工作在执行”这句话是不精确的,至多它是不全面的。那多核处理器的状况下,线程是怎么执行呢?这就须要理解内核线程。

多核 (心) 处理器是指在一个处理器上集成多个运算外围从而进步计算能力,也就是有多个真正并行计算的解决外围,每一个解决外围对应一个内核线程。

内核线程(Kernel Thread,KLT)就是间接由操作系统内核反对的线程,这种线程由内核来实现线程切换,内核通过操作调度器对线程进行调度,并负责将线程的工作映射到各个处理器上。个别一个解决外围对应一个内核线程,比方单核处理器对应一个内核线程,双核处理器对应两个内核线程,四核处理器对应四个内核线程。

当初的电脑个别是双核四线程、四核八线程,是采纳超线程技术将一个物理解决外围模仿成两个逻辑解决外围,对应两个内核线程,所以在操作系统中看到的 CPU 数量是理论物理 CPU 数量的两倍,如你的电脑是双核四线程,关上“工作管理器性能”能够看到 4 个 CPU 的监视器,四核八线程能够看到 8 个 CPU 的监视器。

 

图 6:双核四线程在 Windows8 下查看的后果

超线程技术就是利用非凡的硬件指令,把一个物理芯片模仿成两个逻辑解决外围,让单个处理器都能应用线程级并行计算,进而兼容多线程操作系统和软件,缩小了 CPU 的闲置工夫,进步的 CPU 的运行效率。

这种超线程技术 (如双核四线程) 由处理器硬件的决定,同时也须要操作系统的反对能力在计算机中体现进去。

程序个别不会间接去应用内核线程,而是去应用内核线程的一种高级接口——轻量级过程(Light Weight Process,LWP),轻量级过程就是咱们通常意义上所讲的线程(咱们在这称它为用户线程),因为每个轻量级过程都由一个内核线程反对,因而只有先反对内核线程,能力有轻量级过程。

用户线程与内核线程的对应关系有三种模型:一对一模型、多对一模型、多对多模型,在这以 4 个内核线程、3 个用户线程为例对三种模型进行阐明。

一对一模型

对于一对一模型来说,一个用户线程就惟一地对应一个内核线程(反过来不肯定成立,一个内核线程不肯定有对应的用户线程)。这样,如果 CPU 没有采纳超线程技术(如四核四线程的计算机),一个用户线程就惟一地映射到一个物理 CPU 的线程,线程之间的并发是真正的并发。一对一模型使用户线程具备与内核线程一样的长处,一个线程因某种原因阻塞时其余线程的执行不受影响;此处,一对一模型也能够让多线程程序在多处理器的零碎上有更好的体现。

但一对一模型也有两个毛病:1. 许多操作系统限度了内核线程的数量,因而一对一模型会使用户线程的数量受到限制;2. 许多操作系统内核线程调度时,上下文切换的开销较大,导致用户线程的执行效率降落。

 

图 7:一对一模型

多对一模型

多对一模型将多个用户线程映射到一个内核线程上,线程之间的切换由用户态的代码来进行,因而绝对一对一模型,多对一模型的线程切换速度要快许多;此外,多对一模型对用户线程的数量简直无限度。但多对一模型也有两个毛病:1. 如果其中一个用户线程阻塞,那么其它所有线程都将无奈执行,因为此时内核线程也随之阻塞了;2. 在多处理器零碎上,处理器数量的减少对多对一模型的线程性能不会有显著的减少,因为所有的用户线程都映射到一个处理器上了。

 

图 8:多对一模型

多对多模型

多对多模型联合了一对一模型和多对一模型的长处,将多个用户线程映射到多个内核线程上。多对多模型的长处有:1. 一个用户线程的阻塞不会导致所有线程的阻塞,因为此时还有别的内核线程被调度来执行;2. 多对多模型对用户线程的数量没有限度;3. 在多处理器的操作系统中,多对多模型的线程也能失去肯定的性能晋升,但晋升的幅度不如一对一模型的高。

在当初风行的操作系统中,大都采纳多对多的模型。

 

图 9:多对多模型

查看过程与线程

一个应用程序可能是多线程的,也可能是多过程的,如何查看呢?在 Windows 下咱们只须关上工作管理器就能查看一个应用程序的过程和线程数。按“Ctrl+Alt+Del”或右键快捷工具栏关上工作管理器。

查看过程数和线程数:

图 10:查看线程数和过程数

在“过程”选项卡下,咱们能够看到一个应用程序蕴含的线程数。如果一个应用程序有多个过程,咱们能看到每一个过程,如在上图中,Google 的 chrome 浏览器就有多个过程。同时,如果关上了一个应用程序的多个实例也会有多个过程,如上图中我关上了两个 cmd 窗口,就有两个 cmd 过程。如果看不到线程数这一列,能够在点击“查看抉择列”菜单,减少监听的列。

查看 CPU 和内存的使用率:

在性能选项卡中,咱们能够查看 CPU 和内存的使用率,依据 CPU 应用记录的监视器的个数还能看出逻辑解决外围的个数,如我的双核四线程的计算机就有四个监视器。

图 11:查看 CPU 和内存的使用率

线程的生命周期

当线程的数量小于处理器的数量时,线程的并发是真正的并发,不同的线程运行在不同的处理器上。但当线程的数量大于处理器的数量时,线程的并发会受到一些妨碍,此时并不是真正的并发,因为此时至多有一个处理器会运行多个线程。

在单个处理器运行多个线程时,并发是一种模仿进去的状态。操作系统采纳工夫片轮转的形式轮流执行每一个线程。当初,简直所有的古代操作系统采纳的都是工夫片轮转的抢占式调度形式,如咱们相熟的 Unix、Linux、Windows 及 Mac OS X 等风行的操作系统。

咱们晓得线程是程序执行的最小单位,也是工作执行的最小单位。在晚期只有过程的操作系统中,过程有五种状态,创立、就绪、运行、阻塞(期待)、退出。晚期的过程相当于当初的只有单个线程的过程,那么当初的多线程也有五种状态,当初的多线程的生命周期与晚期过程的生命周期相似。

 图 12:晚期过程的生命周期

过程在运行过程有三种状态:就绪、运行、阻塞,创立和退出状态形容的是过程的创立过程和退出过程。

创立:过程正在创立,还不能运行。操作系统在创立过程时要进行的工作包含调配和建设过程管制块表项、建设资源表格并分配资源、加载程序并建设地址空间;

就绪:工夫片已用完,此线程被强制暂停,期待下一个属于他的工夫片到来;

运行:此线程正在执行,正在占用工夫片;

阻塞:也叫期待状态,期待某一事件 (如 IO 或另一个线程) 执行完;

退出:过程已完结,所以也称完结状态,开释操作系统调配的资源。

 图 13:线程的生命周期

创立:一个新的线程被创立,期待该线程被调用执行;

就绪:工夫片已用完,此线程被强制暂停,期待下一个属于他的工夫片到来;

运行:此线程正在执行,正在占用工夫片;

阻塞:也叫期待状态,期待某一事件 (如 IO 或另一个线程) 执行完;

退出:一个线程实现工作或者其余终止条件产生,该线程终止进入退出状态,退出状态开释该线程所调配的资源。

作者:luoweifu

https://blog.csdn.net/luoweif…

往期举荐

手写一个“打飞机”小游戏附【源代码】[](http://mp.weixin.qq.com/s?__b…

一个基于 SpringBoot2 + MybatisPlus 的商城管理系统,真香~~

为啥《阿里开发手册》一律禁止应用 SELECT *?

Springboot+MybatisPlus 高效实现增删改查,写的切实太好了!!

七个开源的 Spring Boot 前后端拆散我的项目,肯定要珍藏!

值得举荐的十几款 IDEA 插件,大大晋升开发效率【值得珍藏】

【我的项目实战 + 源码】Java 身份证号码识别系统

10 个你可能未曾用过却很有用的 Linux 命令~

面试官:你能说出 办法重载和办法重写 的原理吗?

又发愁没我的项目?java + vue 的前后端拆散的考试零碎【附源码】

发愁没我的项目?用 Java 开发一个乏味的表情生成器【附源码】

如果感觉文章不错,能够在文末 点个赞

正文完
 0