关于golang:Golang并发模型之GMP

从过程谈起

过程与线程的区别是什么？这是一个老成长谈的一道面试题。处于不同层面对该问题的了解也大不相同。对于用户层面来说，过程就是一块运行起来的程序，线程就是程序里的一些并发的性能。对于操作系统层面来说，规范答复是“过程是资源分配的最小单位，线程是cpu调度的最小单位”。接下来先从操作系统层面介绍一下过程与线程。

过程

在程序启动时，操作系统会给该程序调配一块内存空间，对于程序但看到的是一整块间断的内存空间，称为虚拟内存空间，落实到操作系统内核则是一块一块的内存碎片的货色。为的是节俭内核空间，不便对内存治理。

就这片内存空间，又划分为用户空间与内核空间，用户空间只用于用户程序的执行，若要执行各种IO操作，就会通过零碎调用等进入内核空间进行操作。每个过程都有本人的PID，能够通过ps命令查看某个过程的pid，进入/proc/能够查看该过程的详细信息，如cgroup，过程资源大小等信息。

线程

线程是过程的一个执行单元，一个过程能够蕴含多个线程，只有领有了线程的过程才会被CPU执行，所以一个过程起码领有一个主线程。

因为多个线程能够共享同一个过程的内存空间，线程的创立不须要额定的虚拟内存空间，线程之间的切换也就少了如过程切换的切换页表，切换虚拟地址空间此类的微小开销。至于过程切换为什么较大，简略了解是因为过程切换要保留的现场太多如寄存器，栈，代码段，执行地位等，而线程切换只须要上下文切换，保留线程执行的上下文即可。线程的的切换只须要保留线程的执行现场(程序计数器等状态)保留在该线程的栈里，CPU把栈指针，指令寄存器的值指向下一个线程。相比之下线程更加轻量级。

能够说过程面向的次要内容是内存调配治理，而线程次要面向的CPU调度。

协程

尽管线程比过程要轻量级，然而每个线程仍然占有1M左右的空间，在高并发场景下十分吃机器内存，比方构建一个http服务器，如果一个每来一次申请调配一个线程，申请数暴增容易OOM，而且线程切换的开销也是不可漠视的。同时，线程的创立与销毁同样是比拟大的零碎开销，因为是由内核来做的，解决办法也有，能够通过线程池或协程来解决。

协程是用户态的线程，比线程更加的轻量级，操作系统对其没有感知，之所以没有感知是因为协程处于线程的用户栈能感知的范畴，是由用户创立的而非操作系统。

如一个过程可领有以有多个线程一样，一个线程也能够领有多个协程。协程之于线程如同线程之于cpu，领有本人的协程队列，每个协程领有本人的栈空间，在协程切换时候只须要保留协程的上下文，开销要比内核态的线程切换要小很多。

GMP模型

含意

Goroutine的并发编程模型基于GMP模型，简要解释一下GMP的含意：

G:示意goroutine，每个goroutine都有本人的栈空间，定时器，初始化的栈空间在2k左右，空间会随着需要增长。

M:抽象化代表内核线程，记录内核线程栈信息，当goroutine调度到线程时，应用该goroutine本人的栈信息。

P:代表调度器，负责调度goroutine，保护一个本地goroutine队列，M从P上取得goroutine并执行，同时还负责局部内存的治理。

模型

从大体看一下GMP模型。

M代表一个工作线程，在M上有一个P和G，P是绑定到M上的，G是通过P的调度获取的，在某一时刻，一个M上只有一个G（g0除外）。在P上领有一个G队列，外面是曾经就绪的G，是能够被调度到线程栈上执行的协程，称为运行队列。

接下来看一下程序中GMP的散布。

每个过程都有一个全局的G队列，也领有P的本地执行队列，同时也有不在运行队列中的G。如正处于channel的阻塞状态的G，还有脱离P绑定在M的(零碎调用)G，还有执行完结后进入P的gFree列表中的G等等，接下来列举一下常见的几种状态。

状态汇总

G状态

G的次要几种状态：

本文基于Go1.13，具体代码见（<GOROOT>/src/runtime/runtime2.go）

_Gidle：刚刚被调配并且还没有被初始化，值为0，为创立goroutine后的默认值

_Grunnable：没有执行代码，没有栈的所有权，存储在运行队列中，可能在某个P的本地队列或全局队列中(如上图)。

_Grunning：正在执行代码的goroutine，领有栈的所有权(如上图)。

_Gsyscall：正在执行零碎调用，领有栈的所有权，与P脱离，然而与某个M绑定，会在调用完结后被调配到运行队列(如上图)。

_Gwaiting：被阻塞的goroutine，阻塞在某个channel的发送或者接管队列(如上图)。

_Gdead：以后goroutine未被应用，没有执行代码，可能有调配的栈，散布在闲暇列表gFree，可能是一个刚刚初始化的goroutine，也可能是执行了goexit退出的goroutine(如上图)。

_Gcopystac：栈正在被拷贝，没有执行代码，不在运行队列上，执行权在

_Gscan ： GC 正在扫描栈空间，没有执行代码，能够与其余状态同时存在

P的状态

_Pidle ：处理器没有运行用户代码或者调度器，被闲暇队列或者扭转其状态的构造持有，运行队列为空

_Prunning ：被线程 M 持有，并且正在执行用户代码或者调度器(如上图)

_Psyscall：没有执行用户代码，以后线程陷入零碎调用(如上图)

_Pgcstop ：被线程 M 持有，以后处理器因为垃圾回收被进行

_Pdead ：以后处理器曾经不被应用

M的状态

自旋线程：处于运行状态然而没有可执行goroutine的线程(如下图)，数量最多为GOMAXPROC，若是数量大于GOMAXPROC就会进入休眠。

非自旋线程：处于运行状态有可执行goroutine的线程。

调度场景

Channel阻塞：当goroutine读写channel产生阻塞时候，会调用gopark函数，该G会脱离以后的M与P，调度器会执行schedule函数调度新的G到以后M。可参考上一篇文章channel探秘。

零碎调用：当某个G因为零碎调用陷入内核态时，该P就会脱离以后的M，此时P会更新本人的状态为Psyscall，M与G相互绑定，进行零碎调用。完结当前若该P状态还是Psyscall，则间接关联该M和G，否则应用闲置的处理器解决该G。

系统监控：当某个G在P上运行的工夫超过10ms时候，或者P处于Psyscall状态过长等状况就会调用retake函数，触发新的调度。

被动让出：因为是合作式调度，该G会被动让出以后的P，更新状态为Grunnable，该P会调度队列中的G运行。

总结

Go语言中通过GMP模型实现了对CPU和内存的正当利用，使得用户在不必放心内存的状况下体验到线程的益处。虽说协程的空间很小，然而也须要关注一下协程的生命周期，避免过多的协程滞留造成OOM。最近遇到了线上的OOM问题，期待下期一起剖析。

关于golang:Golang并发模型之GMP

过程

线程

协程

含意

模型

状态汇总

G状态

P的状态

M的状态

调度场景

评论

发表回复取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

关于golang:Golang并发模型之GMP

过程

线程

协程

含意

模型

状态汇总

G状态

P的状态

M的状态

调度场景

评论

发表回复 取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

发表回复取消回复