关于golang:转发-Golang-runtime

https://purewhite.io/2019/11/…

调度器构造

调度器治理三个在 runtime 中非常重要的类型：G、M 和 P。哪怕你不写 scheduler 相干代码，你也该当要理解这些概念。

G、M 和 P

一个 G 就是一个 goroutine，在 runtime 中通过类型 g 来示意。当一个 goroutine 退出时，g 对象会被放到一个闲暇的 g 对象池中以用于后续的 goroutine 的应用（译者注：缩小内存调配开销）。

一个 M 就是一个零碎的线程，零碎线程能够执行用户的 go 代码、runtime 代码、零碎调用或者闲暇期待。在 runtime 中通过类型 m 来示意。在同一时间，可能有任意数量的 M，因为任意数量的 M 可能会阻塞在零碎调用中。（译者注：当一个 M 执行阻塞的零碎调用时，会将 M 和 P 解绑，并创立出一个新的 M 来执行 P 上的其它 G。）

最初，一个 P 代表了执行用户 go 代码所须要的资源，比方调度器状态、内存分配器状态等。在 runtime 中通过类型 p 来示意。P 的数量准确地（exactly）等于 GOMAXPROCS。一个 P 能够被了解为是操作系统调度器中的 CPU，p 类型能够被了解为是每个 CPU 的状态。在这里能够放一些须要高效共享但并不是针对每个 P（Per P）或者每个 M（Per M）的状态（译者注：意思是，能够放一些以 P 级别共享的数据）。

调度器的工作是将一个 G（须要执行的代码）、一个 M（代码执行的中央）和一个 P（代码执行所须要的权限和资源）联合起来。当一个 M 进行执行用户代码的时候（比方进入阻塞的零碎调用的时候），就须要把它的 P 偿还到闲暇的 P 池中；为了继续执行用户的 go 代码（比方从阻塞的零碎调用退出的时候），就须要从闲暇的 P 池中获取一个 P。

所有的 g、m 和 p 对象都是调配在堆上且永不开释的，所以它们的内存应用是很稳固的。得益于此，runtime 能够在调度器实现中防止写屏障（译者注：垃圾回收时须要的一种屏障，会带来一些性能开销）。

用户栈和零碎栈

每个存活着的（non-dead）G 都会有一个相关联的用户栈，用户的代码就是在这个用户栈上执行的。用户栈一开始很小（比方 2K），并且动静地成长或者膨胀。

每一个 M 都有一个相关联的零碎栈（也被称为 g0 栈，因为这个栈也是通过 g 实现的）；如果是在 Unix 平台上，还会有一个 signal 栈（也被称为 gsignal 栈）。零碎栈和 signal 栈不能成长，然而足够大到运行任何 runtime 和 cgo 的代码（在纯 go 二进制中为 8K，在 cgo 状况下由零碎调配）。

runtime 代码常常通过调用 systemstack、mcall 或者 asmcgocall 临时性的切换到零碎栈去执行一些非凡的工作，比方：不能被抢占的、不应该扩张用户栈的和会切换用户 goroutine 的。在零碎栈上运行的代码隐含了不可抢占的含意，同时垃圾回收器不会扫描零碎栈。当一个 M 在零碎栈上运行时，以后的用户栈是没有被运行的。

`getg()` 和 `getg().m.curg`

如果想要获取以后用户的 g，须要应用 getg().m.curg。

getg() 尽管会返回以后的 g，然而当正在零碎栈或者 signal 栈上执行的时候，会返回的是以后 M 的 g0 或者 gsignal，而这很可能不是你想要的。

如果要判断以后正在零碎栈上执行还是用户栈上执行，能够应用 getg() == getg().m.curg。

错误处理和上报

在用户代码中，有一些能够被正当地（reasonably）复原的谬误能够像平常一样应用 panic，然而有一些状况下，panic 可能导致立刻的致命的谬误，比方在零碎栈中调用或者当执行 mallocgc 时。

大部分的 runtime 的谬误是不可复原的，对于这些不可复原的谬误应该应用 throw，throw 会打印出 traceback 并立刻终止过程。throw 该当被传入一个字符串常量以防止在该状况下还须要为 string 分配内存。依据约定，更多的信息该当在 throw 之前应用 print 或者 println 打印进去，并且该当以 runtime. 结尾。

为了进行 runtime 的谬误调试，有一个很实用的办法是设置 GOTRACEBACK=system 或 GOTRACEBACK=crash。

同步

runtime 中有多种同步机制，这些同步机制不仅是语义上不同，和 go 调度器以及操作系统调度器之间的交互也是不一样的。

最简略的就是 mutex，能够应用 lock 和 unlock 来操作。这种办法次要用来短期（长期的话性能差）地爱护一些共享的数据。在 mutex 上阻塞会间接阻塞整个 M，而不会和 go 的调度器进行交互。因而，在 runtime 中的最底层应用 mutex 是平安的，因为它还会阻止相关联的 G 和 P 被从新调度（M 都阻塞了，无奈执行调度了）。rwmutex 也是相似的。

如果是要进行一次性的告诉，能够应用 note。note 提供了 notesleep 和 notewakeup。不像传统的 UNIX 的 sleep/wakeup，note 是无竞争的（race-free），所以如果 notewakeup 曾经产生了，那么 notesleep 将会立刻返回。note 能够在应用后通过 noteclear 来重置，然而要留神 noteclear 和 notesleep、notewakeup 不能产生竞争。相似 mutex，阻塞在 note 上会阻塞整个 M。然而，note 提供了不同的形式来调用 sleep：notesleep 会阻止相关联的 G 和 P 被从新调度；notetsleepg 的体现却像一个阻塞的零碎调用一样，容许 P 被重用去运行另一个 G。尽管如此，这依然比间接阻塞一个 G 要低效，因为这须要耗费一个 M。

如果须要间接和 go 调度器交互，能够应用 gopark 和 goready。gopark 挂起以后的 goroutine—— 把它变成 waiting 状态，并从调度器的运行队列中移除 —— 而后调度另一个 goroutine 到以后的 M 或者 P。goready 将一个被挂起的 goroutine 复原到 runnable 状态并将它放到运行队列中。

总结起来如下表：

Interface	G	M	P
(rw)mutex	Y	Y	Y
note	Y	Y	Y/N
park	Y	N	N

原子性

runtime 应用 runtime/internal/atomic 中自有的一些原子操作。这个和 sync/atomic 是对应的，除了办法名因为历史起因有一些区别，并且有一些额定的 runtime 须要的办法。

总的来说，咱们对于 runtime 中 atomic 的应用十分审慎，并且尽可能防止不须要的原子操作。如果对于一个变量的拜访曾经被另一种同步机制所爱护，那么这个曾经被爱护的拜访个别就不须要是原子的。这么做次要有以下起因：

正当地应用非原子和原子操作使得代码更加清晰可读，对于一个变量的原子操作意味着在另一处可能会有并发的对于这个变量的操作。
非原子的操作容许主动的竞争检测。runtime 自身目前并没有一个竞争检测器，然而将来可能会有。原子操作会使得竞争检测器漠视掉这个检测，然而非原子的操作能够通过竞争检测器来验证你的假如（是否会产生竞争）。
非原子的操作能够进步性能。

当然，所有对于一个共享变量的非原子的操作都该当在文档中注明该操作是如何被爱护的。

有一些比拟广泛的将原子操作和非原子操作混合在一起的场景有：

大部分操作都是读，且写操作被锁爱护的变量。在锁爱护的范畴内，读操作没必要是原子的，然而写操作必须是原子的。在锁爱护的范畴外，读操作必须是原子的。
仅仅在 STW 期间产生的读操作，且 STW 期间不会有写操作。那么这个时候，读操作不须要是原子的。

话虽如此，Go Memory Model 给出的倡议依然成立 Don't be [too] clever。runtime 的性能诚然重要，然而鲁棒性（robustness）却更加重要。

堆外内存（Unmanaged memory）

个别状况下，runtime 会尝试应用一般的办法来申请内存（堆上内存，gc 治理的），然而在某些状况 runtime 必须申请一些不被 gc 所治理的堆外内存（unmanaged memory）。这是很必要的，因为有可能该片内存就是内存管理器本身，或者说调用者没有一个 P（译者注：比方在调度器初始化之前，是不存在 P 的）。

有三种形式能够申请堆外内存：

sysAlloc 间接从操作系统获取内存，申请的内存必须是系统页表长度的整数倍。能够通过 sysFree 来开释。
persistentalloc 将多个小的内存申请合并在一起为一个大的 sysAlloc 以防止内存碎片（fragmentation）。然而，顾名思义，通过 persistentalloc 申请的内存是无奈被开释的。
fixalloc 是一个 SLAB格调的内存分配器，调配固定大小的内存。通过 fixalloc 调配的对象能够被开释，然而内存仅能够被雷同的 fixalloc 池所重用。所以 fixalloc 适宜用于雷同类型的对象。

广泛来说，应用以上三种办法分配内存的类型都应该被标记为 //go:notinheap（见后文）。

在堆外内存所调配的对象不应该蕴含堆上的指针对象，除非同时恪守了以下的规定：

所有在堆外内存指向堆上的指针都必须是垃圾回收的根（garbage collection roots）。也就是说，所有指针必须能够通过一个全局变量所拜访到，或者显式地应用 runtime.markroot 来标记。
如果内存被重用了，堆上的指针在被标记为 GC 根并且对 GC 可见前必须以 0 初始化（zero-initialized，见后文）。不然的话，GC 可能会察看到过期的（stale）堆指针。能够参见下文 Zero-initialization versus zeroing.

Zero-initialization versus zeroing

在 runtime 中有两种类型的零初始化，取决于内存是否曾经初始化为了一个类型平安的状态。

如果内存不在一个类型平安的状态，意思是可能因为刚被调配，并且第一次初始化应用，会含有一些垃圾值（译者注：这个概念在日常的 Go 代码中是遇不到的，如果学过 C 语言的同学应该能了解什么意思），那么这片内存必须应用 memclrNoHeapPointers 进行 zero-initialized 或者无指针的写。这不会触发写屏障（译者注：写屏障是 GC 中的一个概念）。

内存能够通过 typedmemclr 或者 memclrHasPointers 来写入零值，设置为类型平安的状态。这会触发写屏障。

Runtime-only 编译指令（compiler directives）

除了 go doc compile 中注明的 //go: 编译指令外，编译器在 runtime 包中反对了额定的一些指令。

go:systemstack

go:systemstack 表明一个函数必须在零碎栈上运行，这个会通过一个非凡的函数前引（prologue）动静地验证。

go:nowritebarrier

go:nowritebarrier 告知编译器如果以下函数蕴含了写屏障，触发一个谬误（这不会阻止写屏障的生成，只是单纯一个假如）。

个别状况下你应该应用 go:nowritebarrierrec。go:nowritebarrier 当且仅当 “最好不要” 写屏障，然而非正确性必须的状况下应用。

go:nowritebarrierrec 与 go:yeswritebarrierrec

go:nowritebarrierrec 告知编译器如果以下函数以及它调用的函数（递归上来），直到一个 go:yeswritebarrierrec 为止，蕴含了一个写屏障的话，触发一个谬误。

逻辑上，编译器会在生成的调用图上从每个 go:nowritebarrierrec 函数登程，直到遇到了 go:yeswritebarrierrec 的函数（或者完结）为止。如果其中遇到一个函数蕴含写屏障，那么就会产生一个谬误。

go:nowritebarrierrec 次要用来实现写屏障本身，用来防止死循环。

这两种编译指令都在调度器中所应用。写屏障须要一个沉闷的 P(getg().m.p != nil)，然而调度器相干代码有可能在没有一个沉闷的 P 的状况下运行。在这种状况下，go:nowritebarrierrec 会用在一些开释 P 或者没有 P 的函数上运行，go:yeswritebarrierrec 会用在从新获取到了 P 的代码上。因为这些都是函数级别的正文，所以开释 P 和获取 P 的代码必须被拆分成两个函数。

go:notinheap

go:notinheap 实用于类型申明，表明了一个类型必须不被调配在 GC 堆上。特地的，指向该类型的指针总是该当在 runtime.inheap 判断中失败。这个类型可能被用于全局变量、栈上变量，或者堆外内存上的对象（比方通过 sysAlloc、persistentalloc、fixalloc 或者其它手动治理的 span 进行调配）。特地的：

new(T)、make([]T)、append([]T, ...) 和隐式的对于 T 的堆上调配是不容许的（只管隐式的调配在 runtime 中是从来不被容许的）。
一个指向一般类型的指针（除了 unsafe.Pointer）不能被转换成一个指向 go:notinheap 类型的指针，就算它们有雷同的底层类型（underlying type）。
任何一个蕴含了 go:notinheap 类型的类型本身也是 go:notinheap 的。如果构造体和数组蕴含 go:notinheap 的元素，那么它们本身也是 go:notinheap 类型。map 和 channel 不容许有 go:notinheap 类型。为了使得事件更加清晰，任何隐式的 go:notinheap 类型都应该显式地表明 go:notinheap。
指向 go:notinheap 类型的指针的写屏障能够被疏忽。

最初一点是 go:notinheap 类型真正的益处。runtime 在底层构造中应用这个来防止调度器和内存分配器的内存屏障以防止非法查看或者单纯进步性能。这种办法是适度的平安（reasonably safe）的并且不会使得 runtime 的可读性升高。

关于golang:转发-Golang-runtime

调度器构造

G、M 和 P

用户栈和零碎栈

`getg()` 和 `getg().m.curg`

错误处理和上报

同步

原子性

堆外内存（Unmanaged memory）

Zero-initialization versus zeroing

Runtime-only 编译指令（compiler directives）

go:systemstack

go:nowritebarrier

go:nowritebarrierrec 与 go:yeswritebarrierrec

go:notinheap

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于golang:转发-Golang-runtime

调度器构造

G、M 和 P

用户栈和零碎栈

getg() 和 getg().m.curg

错误处理和上报

同步

原子性

堆外内存（Unmanaged memory）

Zero-initialization versus zeroing

Runtime-only 编译指令（compiler directives）

go:systemstack

go:nowritebarrier

go:nowritebarrierrec 与 go:yeswritebarrierrec

go:notinheap

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

`getg()` 和 `getg().m.curg`

发表回复取消回复