垃圾回收就是找出不再应用的对象并回收这些内存。如何找出呢?这就不得不说一下三色标记法,这是 Go 语言垃圾回收的根底。本篇文章次要介绍三色标记法,包含三色标记算法,写屏障技术;以及 Go 语言是如何实现三色标记和写屏障的。
三色标记
想想写 C 程序时,咱们须要自申请内存(malloc),应用结束后还须要本人开释内存(free),如果不开释可是会造成内存泄露的。写 Go 程序貌似不须要关注内存的开释,因为垃圾回收帮忙咱们回收了无用内存(称之为垃圾)。思考一下,垃圾回收都负责回收哪些内存呢?通常指的是堆内存,栈上的内存为什么不必回收呢?因为随着函数的调用与返回,栈内存主动调配与开释。那如何辨认堆内存是不是垃圾呢?
垃圾内存的定义应该是什么呢?想想如果没有任何路径能拜访到这块内存,那这块内存是不是就是垃圾内存了?如何判断有无路径能拜访到呢?有一个经典的计划叫援用计数法,如果对象 A 援用了对象 B,这时候 B 对象的援用计数为 1(对象相互援用时更新援用计数),那么对象 B 内存必定就不是垃圾了,因为对象 A 还能拜访到对象 B,而回收之后对象 A 再拜访对象 B 程序是会异样的。那对象 A 如果没有任何路径能拜访到呢?也就是说对象 A 自身就是垃圾,这时候显然对象 A 和对象 B 都应该被回收。
那这样操作呢:先判断对象 A 的援用计数为 0,回收对象 A,同时将对象 A 指向的所有对象援用计数减 1,再判断这些对象的援用计数如果为 0,则回收,以此类推。这种计划可行吗?想想如果对象 A 援用对象 B,并且对象 B 也援用对象 A,也就是呈现了循环援用状况,并且没有其余任何对象援用到这两个对象,实践上这时候对象 A 和对象 B 应该被回收,然而援用计数法又无奈回收这两个对象。
还有什么其余方法吗?想想什么对象肯定不可回收,拜访某对象的路径有什么特点呢?比如说栈对象,比方全局对象呢,这两种类型对象必定是不能轻易回收的,而且堆内存上的对象,一般来说也都是从栈对象或全局对象,逐渐援用,才拜访到的。如下图所示:
那只须要从根对象开始扫描(如栈对象,全局对象),扫描到的对象必定就不是垃圾,剩下的没有被扫描到的对象就是垃圾须要被回收了。这也就是三色标记法的基本思路了。为什么是三色呢?不是只有两种状态吗,已扫描,未扫描;因为还有局部对象处于待扫描状态,想想最后根节点是不是待扫描,扫描到这些节点时,须要以此判断(标记)其指向的所有节点,这些节点将称为下一波待扫描节点。
三色标记法申明了三种类型对象:1)彩色,曾经扫描过的对象;2)灰色,就是待扫描对象;3)红色,没有扫描的对象。整个过程能够总结为:1)从灰色对象汇合中抉择一个对象,标为彩色;2)扫描该对象指向的所有对象,将其退出到灰色对象汇合;3)一直反复步骤 1 /2。扫描完结后,最终只剩下彩色对象与红色对象,而红色对象就是须要回收的垃圾。
思考下 Go 语言是如何实现这一过程呢?彩色对象如何标记呢?最终红色对象是须要回收的,如何实现红色对象的疾速回收呢?还记得上一篇文章介绍内存治理的根本单元是 mspan,申请内存就是从 mspan 查找闲暇内存块(bitmap 记录内存闲暇与否,allocBits)。其实还有另一个字段,也是一个 bitmap,用来实现内存块的标记:
type mspan struct {gcmarkBits *gcBits}
s.gcmarkBits = newMarkBits(s.nelems)
gcmarkBits 的比特位数目与 mspan 分隔的内存块数目统一,1 示意彩色对象,0 示意红色对象。等等,那灰色对象呢?一个必填位怎么示意三种色彩?想想如果用两个比特位示意黑灰白三种对象,第一步从灰色对象汇合中抉择一个对象将其标黑,灰色对象汇合在哪?怎么抉择灰色对象?遍历吗?所以灰色对象,其实是另外有一个队列保护的,而且灰色对象的 gcmarkBits 曾经置位 1 了。函数 greyobject 实现了对象标灰的逻辑,参考如下:
func greyobject(obj, base, off uintptr, span *mspan, gcw *gcWork, objIndex uintptr) {
// objIndex 为该内存块在 mspan 的地位
mbits := span.markBitsForIndex(objIndex)
// 如果没有标记才执行标记操作
if mbits.isMarked() {return}
mbits.setMarked()
// 退出队列
if !gcw.putFast(obj) {gcw.put(obj)
}
}
// wbuf1 就是一个数组
func (w *gcWork) putFast(obj uintptr) bool {
wbuf := w.wbuf1
if wbuf == nil {return false} else if wbuf.nobj == len(wbuf.obj) {return false}
wbuf.obj[wbuf.nobj] = obj
wbuf.nobj++
return true
}
而整个标记扫描过程,其实就是一个 for 循环,一直从队列获取灰色对象,扫描并标记其指向的对象(垃圾回收初始化阶段,曾经将跟对象增加到灰色对象汇合了):
for {
// 获取灰色对象
b := gcw.tryGetFast()
if b == 0 {b = gcw.tryGet()
}
// 扫描 & 标记
scanobject(b, gcw)
}
貌似整个逻辑略微清晰了,不过你有没有想过这么一个问题:获取到灰色对象 A 后,须要扫描其指向的所有对象,那么对象 A 存储的是什么数据呢?有蕴含指针吗?哪几个字节存储的是指针呢?之前咱们提到,申请内存时,依据该类型对象是否蕴含指针,分为两种规格的 mspan,所以扫描到某个对象时,先计算出其属于哪一个 mspan(怎么计算呢?),判断 mspan 规格就晓得该对象是否蕴含指针了。只是,哪几个字节蕴含指针了呢?不可能对象的所有字段都是指针类型吧?
先解决第一个问题,怎么计算对象调配到那种类型的 mspan 呢?毕竟只有一个内存首地址。其实在调配 mspan 的时候,为每一个 heapArena 记录了其所有的 mspan
//arenas 数组保护了所有的 heapArena
arenas [1 << arenaL1Bits]*[1 << arenaL2Bits]*heapArena
// 为 heapArena 保护其调配的 mspan
func (h *mheap) setSpans(base, npage uintptr, s *mspan)
// 返回 mspan 指针,不就晓得了其规格
func spanOfUnchecked(p uintptr) *mspan {
// heapArena 大小为 64M,并且首地址也是 64M 对齐(首地址除以 64M 取整能够作为 heapArena 索引)ai := arenaIndex(p)
// 首地址除以页大小,就是第几个页,取余数
return mheap_.arenas[ai.l1()][ai.l2()].spans[(p/pageSize)%pagesPerArena]
}
再解决第二个问题,如何晓得对象哪几个字节存储的是指针呢?貌似没有什么好方法,只能记录了。heapArena 应用一个 bitmap 保护了每一个 8 字节内存是否是指针:
// bitmap 须要多少字节
heapArenaBitmapBytes = heapArenaBytes / (goarch.PtrSize * 8 / 2)
type heapArena struct {
//
bitmap [heapArenaBitmapBytes]byte
// 下面刚介绍过,每一个 heapArena 记录了其所有的 mspan
spans [pagesPerArena]*mspan
}
实践上不应该是 64M/8 比特位,64M/8/8 字节吗?怎么貌似 bitmap 大小还翻倍了?其实 bitmap 不止记录每一个 8 字节内存是否是指针,还记录了后续字节是否须要持续扫描。想想看,如果一个对象占了 1024 字节,并且只有第一个字段是指针类型,难道须要扫描 128 次吗?bitmap 的每一个字节,0- 3 比特示意是否蕴含指针,4- 7 比特示意是否须要持续扫描。
函数 scanobject 实现了对象扫描的过程,显著能看到判断是否蕴含指针,查找指针指向的对象并退出到灰色对象汇合等等:另外 mallocgc 函数在申请内存时,如果发现该对象蕴含指针,还须要保护更新 bitmap 对应比特位。
func scanobject(b uintptr, gcw *gcWork) {
// 计算 bitmap
hbits := heapBitsForAddr(b)
// 计算 mspan
s := spanOfUnchecked(b)
// 对象占用内存大小
n := s.elemsize
// 遍历扫描这一块内存,留神 hbits.next(),挪动到下一对比特位
for i = 0; i < n; i, hbits = i+goarch.PtrSize, hbits.next() {bits := hbits.bits()
if bits&bitScan == 0 {break // no more pointers in this object}
if bits&bitPointer == 0 {continue // not a pointer}
// obj 就是指向的对象
obj := *(*uintptr)(unsafe.Pointer(b + i))
// 指向本人不须要扫描
if obj != 0 && obj-b >= n {
// 查找对象,退出到灰色对象汇合
if obj, span, objIndex := findObject(obj, b, i); obj != 0 {greyobject(obj, b, i, span, gcw, objIndex)
}
}
}
}
func mallocgc(size uintptr, typ *_type, needzero bool) unsafe.Pointer {
if !noscan {
// 保护 bitmap
heapBitsSetType(uintptr(x), size, dataSize, typ)
}
}
type _type struct {
// 每种类型的 gcdata 保护着垃圾回收相干数据
gcdata *byte
}
最初还有一个问题:如何实现红色对象的疾速回收呢?想想 mspan.allocBits 记录内存闲暇与否,0 示意闲暇,1 示意已调配;mspan.gcmarkBits 用户标记彩色和红色对象,0 示意红色也就是须要回收的对象,1 示意彩色对象。两个字段定义很近进!在三色标记实现之后,只须要 allocBits=gcmarkBits 不就能够了!
写屏障
Go 语言是多线程 + 多协程程序,垃圾回收过程也是基于协程并发执行,并且垃圾回收器标记 - 清理过程中,用户协程还失常执行。这就必然存在一个问题:假如初始状况对象 A 指向对象 B,对象 B 指向对象 C,也就是 A ->B->C;垃圾回收器曾经标记对象 A 为彩色,对象 B 为灰色,对象 C 还未扫描到是红色;因为用户协程并发执行,此时若用户协程批改对象 B 指向 nil,对象 A 指向对象 C;对象 A 曾经是彩色,不会再扫描了,对象 B 指向的又是空地址,此时对象 C 将永远无奈再次被扫描。最终,实践上对象 C 还在应用(对象 A 指向了对象 C),然而因为对象还是红色,回被回收。也就是垃圾回收器出错了。再想想看,标记扫描过程中,用户协程新申请的内存呢?垃圾回收器还能扫描到这些对象吗?
实质上是因为用户协程与垃圾回收器并发执行,导致彩色的对象指向了红色对象,而且没有其余任何灰色对象存在某条链路能指向该红色对象;最终,不应该被回收的对象被谬误的回收了,当然也可能导致某些应该被回收的对象没有被回收(这还好,至多不会异样,下次还能回收)。那怎么办呢?有什么方法吗?总不能在垃圾回收器标记 - 清理过程暂停所有用户协程吧。
在介绍解决方案之前,先提出几个概念:1)强三色不变性,彩色对象执行指向灰色对象,灰色对象只能指向红色对象,这样垃圾回收显然不会有任何异样;2)弱三色不变性,彩色对象能够指向红色对象,然而肯定要存在一条链路,使得存在灰色对象指向该红色对象,这样通过若干次扫描,仍然能扫描到该红色对象。
只有始终满足强三色不变性与弱三色不变性,垃圾回收就不会有问题。而针对这两个概念,也提出了两种不通的屏障技术(垃圾回收过程中,用户协程更改指针援用时,额定增加一些操作),插入写屏障和删除写屏障。
举个例子,假如初始状况对象 A 指向对象 B,对象 B 指向对象 C,也就是 A ->B->C;此时用户协程批改对象 A 指向对象 C,也就是彩色对象指向了红色对象,从而突破了强三色不变性,怎么办呢?在批改指针援用的同时,将对象 C 染为灰色即可,这样仍然满足强三色不变性。这种计划称为插入写屏障,伪代码如下:
//slot 行将指向 ptr,如果 prt 为红色,将 ptr 染为灰色对象
writePointer(slot, ptr):
shade(ptr)
*slot = ptr
再举个例子,假如初始状况对象 A 指向对象 B,对象 B 指向对象 C,也就是 A ->B->C;此时用户协程批改对象 A 指向对象 C,也就是彩色对象指向了红色对象,然而仍然满足弱三色不变性,因为通过灰色对象 B 还是有可能扫描到对象 C 的;当然后续如果要批改对象 B 的援用时,是须要将对象 C 染为灰色的。这种计划称为删除写屏障,伪代码如下:
//slot 行将指向 ptr,也就是删除了 slot 和另一个对象的援用关系,将另一个对象染为灰色对象
writePointer(slot, ptr)
shade(*slot)
*slot = ptr
Go 语言同时应用插入写屏障与删除写屏障,也就是说既将 ptr 染为灰色,又将 * slot 染为灰色。当然只有在垃圾回收过程中,才须要开启写屏障,平时是不须要的(升高性能)。
咱们平时写的 Go 程序,必定存在对象的相互援用,以及援用关系的变更,也没看到什么写屏障逻辑啊。其实在编译过程,会注入写屏障相干逻辑。咱们写一个小程序,反编译看看汇编代码,测试一下:
package main
type student struct {
score int
name string
next *student
}
func main() {var s = new(student)
var s1 = new(student)
var s2 = new(student)
s.next = s1
s1.next = s2
}
/*
go tool compile -S -N -l test.go
"".main STEXT
0x0060 00096 (test.go:14) CMPL runtime.writeBarrier(SB), $0
0x0067 00103 (test.go:14) JEQ 107
0x0069 00105 (test.go:14) JMP 113
0x006b 00107 (test.go:14) MOVQ DX, 24(CX)
0x006f 00111 (test.go:14) JMP 120
0x0071 00113 (test.go:14) CALL runtime.gcWriteBarrierDX(SB)
*/
能够看到,判断 runtime.writeBarrier 如果不为 0,则跳转到 runtime.gcWriteBarrierDX 执行写屏障逻辑。在开启垃圾回收过程时,开启了写屏障标识:
func setGCPhase(x uint32) {atomic.Store(&gcphase, x)
// 在标记 - 清理过程时,开启写屏障标识
writeBarrier.needed = gcphase == _GCmark || gcphase == _GCmarktermination
writeBarrier.enabled = writeBarrier.needed || writeBarrier.cgo
}
写屏障逻辑次要做了什么呢?其实就是退出到了一个缓存队列,灰度对象队列为空时,或者标记扫描过程完结时,会将该缓存队列的对象标灰(重新加入到灰色队列)从而再次扫描。如上面程序事例:
// 标记过程
for {b := gcw.tryGetFast()
if b == 0 {b = gcw.tryGet()
if b == 0 {
//flushes p's write barrier buffer to the GC work queue
wbBufFlush(nil, 0)
b = gcw.tryGet()}
}
}
另外其实还有很多底层函数自身也都蕴含写屏障逻辑,参考 atomicstorep 函数(指针援用赋值)以及其调用:
func atomicstorep(ptr unsafe.Pointer, new unsafe.Pointer) {
if writeBarrier.enabled {atomicwb((*unsafe.Pointer)(ptr), new)
}
atomic.StorepNoWB(noescape(ptr), new)
}
最初还有一个问题,已有对象援用关系变更有写屏障技术保障三色不变性,那新申请的对象呢?间接标记为彩色对象呗!这个过程也能在内存调配主函数 mallocgc 看到:
func mallocgc(size uintptr, typ *_type, needzero bool) unsafe.Pointer {
if gcphase != _GCoff {
// 新申请对象标黑
gcmarknewobject(span, uintptr(x), size, scanSize)
}
}
总结
本篇文章次要介绍了三色标记的整个过程以及实现细节,留神须要联合内存治理文章一起学习;另外因为用户协程与垃圾回收的并发执行,可能导致的回收谬误,Go 语言还引入了写屏障技术。