首先咱们来看看 Go 官网团队是如何定义切片的,在 A Tour of Go 中是这样写道:

An array has a fixed size. A slice, on the other hand, is a dynamically-sized, flexible view into the elements of an array. In practice, slices are much more common than arrays.

简略的说切片就是一个建设在数组之上的动静伸缩、灵便的「视图」。理论我的项目中,切片会比数组更罕用。以下是显式在数组上创立切片和创立切片的切片的办法(理论我的项目中更罕用的应该是通过 make 内置函数来创立):

//// main.go//func main() {    arr := [...]int{1, 3, 5, 7, 9}    s1 := arr[:3]    fmt.Printf("s1 = %v, len = %d, cap = %d\n", s1, len(s1), cap(s1))    // s1 = [1 3 5], len = 3, cap = 5    s2 := arr[2:]    fmt.Printf("s2 = %v, len = %d, cap = %d\n", s2, len(s2), cap(s2))    // s2 = [5 7 9], len = 3, cap = 3    s3 := s1[3:]    fmt.Printf("s3 = %v, len = %d, cap = %d\n", s3, len(s3), cap(s3))    // s3 = [], len = 0, cap = 2    s4 := s1[2:3:3]    fmt.Printf("s4 = %v, len = %d, cap = %d\n", s4, len(s4), cap(s4))    // s4 = [5], len = 1, cap = 1    s5 := []int{2, 4, 6, 8}    fmt.Printf("s5 = %v, len = %d, cap = %d\n", s5, len(s5), cap(s5))    // s5 = [2 4 6 8], len = 4, cap = 4}

须要阐明的是,基于切片的切片和间接创立的切片(make 办法)能够看作是底层隐含了一个匿名数组(新建的数组或是援用其余切片的底层数组),这与后面对切片的定义并不相违反。

约定

本文基于 go1.16 版本的源码进行剖析,因为自 go.17 之后 Go 应用「基于寄存器的调用约定」代替了「基于堆栈的调用约定」。这个批改让编译后的二进制文件更小同时也带来了些微的性能晋升,然而同时略微减少了剖析汇编代码的复杂程度。为了便于剖析调用和展现运行时的一些个性,所以这里采纳 go1.16 版本进行剖析。

对于「基于寄存器的调用约定」能够参考以下内容进行理解:

  • Proposal: Register-based Go calling convention
  • Discussion: switch to a register-based calling convention for Go functions
  • src/cmd/compile/ABI-internal.md

切片的底层数据结构

在 Go 语言中切片实际上是一个蕴含三个字段的构造体,该构造体的定义能够在 runtime/slice.go 中找到:

//// runtime/slice.go//type slice struct {    array unsafe.Pointer    // 指向底层数组,是某一块内存的首地址    len   int               // 切片的长度    cap   int               // 切片的容量}

当咱们须要通过对底层数据结构做一些手脚来达到某些目标时,咱们能够应用 reflect 包中导出的构造体定义:

//// reflect/value.go//// SliceHeader is the runtime representation of a slice.// It cannot be used safely or portably and its representation may// change in a later release.// Moreover, the Data field is not sufficient to guarantee the data// it references will not be garbage collected, so programs must keep// a separate, correctly typed pointer to the underlying data.type SliceHeader struct {    Data uintptr    Len  int    Cap  int}

如果感觉文字看起来比拟形象,能够从上面的这张图中去了解(其中 data 指向数组的的起始地位):

切片的技巧与陷阱

如果单纯看内存中的数据只是一串无意义的 0 或者 1 ,而赋予这些数据意义的则是咱们的程序如何解释他们。因为切片的 Data 字段只是一个指向某一块内存的地址,而咱们能够通过一些「危险」的形式赋予内存意义,从而实现一些 Go 语法上不容许的事件。请留神:在应用这些技巧时,你应该清晰地明确你正在做的事件与相应的副作用

字符串与字节切片的零拷贝转换

Go 中的字符串其实就是一段固定长度的字节数组,而咱们晓得切片就是建设在数组之上的视图,所以咱们能够这么做:

func String(bs []byte) (s string) {    hdr := (*reflect.StringHeader)(unsafe.Pointer(&s))    hdr.Data = (*reflect.SliceHeader)(unsafe.Pointer(&bs)).Data    hdr.Len = (*reflect.SliceHeader)(unsafe.Pointer(&bs)).Len    return}func Bytes(s string) (bs []byte) {    hdr := (*reflect.SliceHeader)(unsafe.Pointer(&bs))    hdr.Data = (*reflect.StringHeader)(unsafe.Pointer(&s)).Data    hdr.Len = (*reflect.StringHeader)(unsafe.Pointer(&s)).Len    hdr.Cap = hdr.Len    return}
一道面试陷阱题

首先咱们晓得 Go 都是以传值形式调用的(切片、通道的外部实现都是一个构造体),接着咱们来看一个陷阱:

func AppendSlice(s []int) {    s = append(s, 1234)    fmt.Printf("s = %v, len = %d, cap = %d\n", s, len(s), cap(s))    // s = [1234], len = 1, cap = 8}func main() {    s := make([]int, 0, 8)    AppendSlice(s)    fmt.Printf("s = %v, len = %d, cap = %d\n", s, len(s), cap(s))    // s = [], len = 0, cap = 8}

这里的切片 s 的容量足够包容 append 之后的元素,但为什么在 main 函数中打印的切片是空的呢?能够本人思考下后再查看答案:

答案:因为切片在运行时世纪上是一个构造体,同时 Go 是通过传值形式进行调用的。所以实际上咱们能够换个形式再看这个代码:

type Slice struct {    Data uintptr    Len  int    Cap  int}func AppendSlice(s Slice) {    if s.Len+1 > s.Cap {        // grow slice ...    }    *(*int)(unsafe.Pointer(s.Data + uintptr(s.Len)*8)) = 1024    s.Len += 1}func main() {    s := Slice{Data: 0x12345, Len: 0, Cap: 8}    AppendSlice(s)    fmt.Printf("s = %+v, len = %d, cap = %d\n", s, s.Len, s.Cap)}

置信看到这里你曾经懂了我想表白的内容。最初,咱们 append 的内容理论曾经写到内存里,因为 main 函数中的切片 s.len 还是 0 ,导致咱们无奈看到这个元素,咱们能够通过以下办法从新发现:

func main() {    s := make([]int, 0, 8)    AppendSlice(s)    fmt.Printf("s = %v, len = %d, cap = %d\n", s, len(s), cap(s))    // s = [], len = 0, cap = 8    (*reflect.SliceHeader)(unsafe.Pointer(&s)).Len = 1    fmt.Printf("s = %v, len = %d, cap = %d\n", s, len(s), cap(s))    // s = [1234], len = 1, cap = 8}

切片的扩容

在日常开发中,常常会通过 append 内置办法将一个或多个值增加到切片的开端来达到扩容的目标。因为切片是基于一个数组的「视图」,而数组的大小是不可变的,所以在 append 过程中如果数组的长度不足以增加更多的值,就须要对底层数组进行扩容。能够通过如下代码从内部看一下扩容是怎么样的:

//// main.go//func main() {    var s []int    fmt.Printf("s = %v, len = %d, cap = %d\n", s, len(s), cap(s))    // s = [], len = 0, cap = 0    s = append(s, 1)    fmt.Printf("append(1) => %v, len = %d, cap = %d\n", s, len(s), cap(s))    // append(1) => [1], len = 1, cap = 1    s = append(s, 2)    fmt.Printf("append(2) => %v, len = %d, cap = %d\n", s, len(s), cap(s))    // append(2) => [1 2], len = 2, cap = 2    s = append(s, 3)    fmt.Printf("append(3) => %v, len = %d, cap = %d\n", s, len(s), cap(s))    // append(3) => [1 2 3], len = 3, cap = 4    s = append(s, 4, 5)    fmt.Printf("append(4, 5) => %v, len = %d, cap = %d\n", s, len(s), cap(s))    // append(4, 5) => [1 2 3 4 5], len = 5, cap = 8    s = append(s, 6, 7, 8, 9)    fmt.Printf("append(6, 7, 8, 9) => %v, len = %d, cap = %d\n\n", s, len(s), cap(s))    // append(6, 7, 8, 9) => [1 2 3 4 5 6 7 8 9], len = 9, cap = 16    s1 := []int{1, 2, 3}    fmt.Printf("s1 = %v, len = %d, cap = %d\n", s1, len(s1), cap(s1))    // s1 = [1 2 3], len = 3, cap = 3    s1 = append(s1, 4)    fmt.Printf("append(4) => %v, len = %d, cap = %d\n", s1, len(s1), cap(s1))    // append(4) => [1 2 3 4], len = 4, cap = 6    s1 = append(s1, 5, 6, 7)    fmt.Printf("append(5, 6, 7) => %v, len = %d, cap = %d\n\n", s1, len(s1), cap(s1))    // append(5, 6, 7) => [1 2 3 4 5 6 7], len = 7, cap = 12    s2 := []int{0}    fmt.Printf("s2 => len = %d, cap = %d\n", len(s2), cap(s2))    // s2 => len = 1, cap = 1    for i := 0; i < 13; i++ {        for j, n := 0, 1<<i; j < n; j++ {            s2 = append(s2, j)        }        fmt.Printf("append(<%d>...) => len = %d, cap = %d\n", 1<<i, len(s2), cap(s2))        // append(<1>...) => len = 2, cap = 2        // append(<2>...) => len = 4, cap = 4        // append(<4>...) => len = 8, cap = 8        // append(<8>...) => len = 16, cap = 16        // append(<16>...) => len = 32, cap = 32        // append(<32>...) => len = 64, cap = 64        // append(<64>...) => len = 128, cap = 128        // append(<128>...) => len = 256, cap = 256        // append(<256>...) => len = 512, cap = 512        // append(<512>...) => len = 1024, cap = 1024        // append(<1024>...) => len = 2048, cap = 2304        // append(<2048>...) => len = 4096, cap = 4096        // append(<4096>...) => len = 8192, cap = 9216    }}

察看输入后果,切片增长的趋势大抵上是以翻倍的模式进行,接下来咱们来验证一下。

从反汇编开始

内置办法 append 的函数签名为 func append(slice []Type, elems ...Type) []Type,该办法并没有具体的办法体实现,而是在编译器执行两头代码生成时将 append 办法替换成实在的运行时函数。咱们来看示例代码:

//// main.go//func main() {    var s []int    s = append(s, 1234)    s = append(s, 5678)}// go tool compile -N -l -S main.go > main.S// // -N disable optimizations : 禁止优化// -l disable inlining : 禁止内联// -S print assembly listing : 输入汇编

能够应用 go tool compile 命令导出以上代码的汇编内容,如下所示:

"".main STEXT size=270 args=0x0 locals=0x68 funcid=0x0        // func main()    0x0000 00000 (main.go:3)    TEXT    "".main(SB), ABIInternal, $104-0    // 查看是否须要扩大栈空间    0x0000 00000 (main.go:3)    MOVQ    (TLS), CX    0x0009 00009 (main.go:3)    CMPQ    SP, 16(CX)    0x000d 00013 (main.go:3)    JLS     260    // 为 main 函数开拓栈空间    0x0013 00019 (main.go:3)    SUBQ    $104, SP    0x0017 00023 (main.go:3)    MOVQ    BP, 96(SP)    0x001c 00028 (main.go:3)    LEAQ    96(SP), BP    // 初始化切片 s, 别离为切片的三个字段赋零值    0x0021 00033 (main.go:4)    MOVQ    $0, "".s+72(SP)       // s.Data = null    0x002a 00042 (main.go:4)    XORPS   X0, X0                // 这里应用 128 位的 XMM 寄存器一次性初始化两个字段    0x002d 00045 (main.go:4)    MOVUPS  X0, "".s+80(SP)       // s.Len = s.Cap = 0    0x0032 00050 (main.go:5)    JMP     52    // 第一次插入并进行切片扩容    // func growslice(et *_type, old slice, cap int) slice    0x0034 00052 (main.go:5)    LEAQ    type.int(SB), AX        // 获取切片元素类型的指针    0x003b 00059 (main.go:5)    MOVQ    AX, (SP)                // 第一个参数 et 压栈    0x003f 00063 (main.go:5)    XORPS   X0, X0                  // 应用 128 位的 XMM 寄存器缩小应用的指令数量    0x0042 00066 (main.go:5)    MOVUPS  X0, 8(SP)               // 第二个参数 old 的 .Data 和 .Len 字段初始化    0x0047 00071 (main.go:5)    MOVQ    $0, 24(SP)              // 第二个参数 old 的 .Cap 字段初始化    0x0050 00080 (main.go:5)    MOVQ    $1, 32(SP)              // 第三个参数 cap 压栈, 值为 1    0x0059 00089 (main.go:5)    CALL    runtime.growslice(SB)   // 调用 runtime.growslice 办法进行切片扩容    0x005e 00094 (main.go:5)    MOVQ    40(SP), AX              // 返回值 r.Data    0x0063 00099 (main.go:5)    MOVQ    56(SP), CX              // 返回值 r.Cap    0x0068 00104 (main.go:5)    MOVQ    48(SP), DX              // 返回值 r.Len = 0    0x006d 00109 (main.go:5)    LEAQ    1(DX), BX               // 返回值 r.Len = 0 的值加 1 赋值给 BX    0x0071 00113 (main.go:5)    JMP     115    0x0073 00115 (main.go:5)    MOVQ    $1234, (AX)             // 将须要 append 的元素保留到 .Data 所指向的地位    0x007a 00122 (main.go:5)    MOVQ    AX, "".s+72(SP)         // s.Data = r.Data    0x007f 00127 (main.go:5)    MOVQ    BX, "".s+80(SP)         // s.Len = r.Len    0x0084 00132 (main.go:5)    MOVQ    CX, "".s+88(SP)         // s.Cap = r.Cap    // 查看是否须要切片扩容, 再执行插入操作    0x0089 00137 (main.go:6)    LEAQ    2(DX), SI               // 返回值 r.Len = 0 的值加 2 赋值给 SI    0x008d 00141 (main.go:6)    CMPQ    CX, SI                  // 比照 r.Cap 和 Len 的值 (r.Cap - Len)    0x0090 00144 (main.go:6)    JCC     148                     // >= unsigned    0x0092 00146 (main.go:6)    JMP     190                     // 如果 r.Cap < Len, 则跳转到 190 进行切片扩容    0x0094 00148 (main.go:6)    JMP     150                     // 如果 r.Cap >= Len, 则间接将元素增加到开端    0x0096 00150 (main.go:6)    LEAQ    (AX)(DX*8), DX          // 保留元素的地址 DX = (r.Data + r.Len(0) * 8)    0x009a 00154 (main.go:6)    LEAQ    8(DX), DX               // r.Len = 0 且曾经有一个元素, 所以这里须要 +8    0x009e 00158 (main.go:6)    MOVQ    $5678, (DX)             // 写入数据    0x00a5 00165 (main.go:6)    MOVQ    AX, "".s+72(SP)         // s.Data = r.Data    0x00aa 00170 (main.go:6)    MOVQ    SI, "".s+80(SP)         // s.Len = r.Len    0x00af 00175 (main.go:6)    MOVQ    CX, "".s+88(SP)         // s.Cap = r.Cap    // 清理 main 函数的栈空间并返回    0x00b4 00180 (main.go:7)    MOVQ    96(SP), BP    0x00b9 00185 (main.go:7)    ADDQ    $104, SP    0x00bd 00189 (main.go:7)    RET    // 第二次插入空间不够, 须要再次扩容    // func growslice(et *_type, old slice, cap int) slice    0x00be 00190 (main.go:5)    MOVQ    DX, ""..autotmp_1+64(SP)    // 备份 DX = r.Len = 0 到一个长期变量上    0x00c3 00195 (main.go:6)    LEAQ    type.int(SB), DX            // 获取切片元素类型的指针    0x00ca 00202 (main.go:6)    MOVQ    DX, (SP)                    // 第一个参数 et 压栈    0x00ce 00206 (main.go:6)    MOVQ    AX, 8(SP)                   // 第二个参数 old.Data 压栈    0x00d3 00211 (main.go:6)    MOVQ    BX, 16(SP)                  // 第二个参数 old.Len = 1 压栈    0x00d8 00216 (main.go:6)    MOVQ    CX, 24(SP)                  // 第二个参数 old.Cap 压栈    0x00dd 00221 (main.go:6)    MOVQ    SI, 32(SP)                  // 第三个参数 cap = 2 压栈    0x00e2 00226 (main.go:6)    CALL    runtime.growslice(SB)       // 执行切片扩容, 扩容之后只有 Cap, Data 会变    0x00e7 00231 (main.go:6)    MOVQ    40(SP), AX                  // 笼罩切片 s.Data = r.Data    0x00ec 00236 (main.go:6)    MOVQ    48(SP), CX                  // 笼罩切片 s.Len = r.Len    0x00f1 00241 (main.go:6)    MOVQ    56(SP), DX                  // 笼罩切片 s.Cap = r.Cap    0x00f6 00246 (main.go:6)    LEAQ    1(CX), SI                   // 将 r.Len + 1 保障后续步骤的寄存器能对上    0x00fa 00250 (main.go:6)    MOVQ    DX, CX                      // 保障后续步骤的寄存器能绝对应    0x00fd 00253 (main.go:6)    MOVQ    ""..autotmp_1+64(SP), DX    // 复原 DX 的值    0x0102 00258 (main.go:6)    JMP     150    // 执行栈扩大    0x0104 00260 (main.go:6)    NOP    0x0104 00260 (main.go:3)    CALL    runtime.morestack_noctxt(SB)    0x0109 00265 (main.go:3)    JMP     0

以上汇编代码中有一些比拟有意思的点,咱们来说道说道:

  • 应用 XMM 寄存器对应的 XORPSMOVUPS 指令一次性初始化 16 字节的数据,而如果应用 MOVQ 一次只能清空 8 个字节,这意味着须要两倍的指令能力达到雷同的目标。
  • 应用 LEAQ 来计算而不是 ADDQMULQ。起因是 LEAQ 的指令十分短,还能做简略的算式运算。并且 LEAQ 指令不占用 ALU,对并行的反对比拟敌对。

回到正题,通过汇编代码能够察看到在运行时执行扩容操作的是 runtime.growslice 办法(位于 runtime/slice.go 文件内),接下来咱们就来具体扒拉扒拉它是如何实现切片扩容的。

对于切片扩容的相干提案:

  • [proposal: Go 2: allow cap(make([]T, m, n)) > n][14]

深刻扩容的实现

首先咱们来看看 runtime.growslice 的办法签名以及正文内容:

//// runtime.slice.go//// growslice handles slice growth during append.// It is passed the slice element type, the old slice, and the desired new minimum capacity,// and it returns a new slice with at least that capacity, with the old data// copied into it.// The new slice's length is set to the old slice's length,// NOT to the new requested capacity.// This is for codegen convenience. The old slice's length is used immediately// to calculate where to write new values during an append.// TODO: When the old backend is gone, reconsider this decision.// The SSA backend might prefer the new length or to return only ptr/cap and save stack space.func growslice(et *_type, old slice, cap int) slice {}

从办法签名以及正文能够得悉:该办法会依据切片的元素类型以后切片以及新切片所需的最小容量(即新切片的长度)进行扩容,返回一个至多具备指定容量的新切片,并将旧切片中的数据拷贝过来。

签名中 slice 就是下面咱们提到的切片构造体,另外一个 _type 类型则比拟生疏,先来看看这个类型是怎么定义的:

//// runtime/type.go//// Needs to be in sync with ../cmd/link/internal/ld/decodesym.go:/^func.commonsize,// ../cmd/compile/internal/reflectdata/reflect.go:/^func.dcommontype and// ../reflect/type.go:/^type.rtype.// ../internal/reflectlite/type.go:/^type.rtype.type _type struct {    size       uintptr // 类型所占内存的大小    ptrdata    uintptr // size of memory prefix holding all pointers    hash       uint32  // 类型的哈希值,在接口断言和接口查问中应用    tflag      tflag   // 类型的特色标记    align      uint8   // _type 作为整体保留时的对齐字节数    fieldAlign uint8   // 以后构造字段的对齐字节数    kind       uint8   // 根底类型的枚举值,与 reflect.Kind 的值雷同,决定了如何解析该类型    // function for comparing objects of this type    // (ptr to object A, ptr to object B) -> ==?    equal func(unsafe.Pointer, unsafe.Pointer) bool    // gcdata stores the GC type data for the garbage collector.    // If the KindGCProg bit is set in kind, gcdata is a GC program.    // Otherwise it is a ptrmask bitmap. See mbitmap.go for details.    gcdata    *byte    // GC 的相干信息    str       nameOff  // 类型的名称字符串在二进制文件中的偏移值。由链接器负责填充    ptrToThis typeOff  // 类型元信息(即以后构造体)的指针在编译后二进制文件中的偏移值。由链接器负责填充}

从下面的汇编代码中,能够看到传入的符号是 type.int(SB) ,这个符号会在链接阶段进行符号重定位时进行填充和替换。其中咱们只须要用到 _type 类型中的 size 字段(用于计算新切片占用内存的大小)。

第一局部:计算新切片的容量

回到代码中,首先来看前半部分的实现。这部分代码次要是为了计算失去新切片的容量,不便之后申请内存应用。间接看代码:

//// runtime/slice.go //// -- 为了便于剖析和展现, 代码通过删减 --//// et: 切片的元素类型// old: 以后切片// cap: 新切片所需的最小容量func growslice(et *_type, old slice, cap int) slice {    newcap := old.cap    doublecap := newcap + newcap    if cap > doublecap {        newcap = cap    } else {        if old.cap < 1024 {            newcap = doublecap        } else {            // Check 0 < newcap to detect overflow            // and prevent an infinite loop.            for 0 < newcap && newcap < cap {                newcap += newcap / 4            }            // Set newcap to the requested cap when            // the newcap calculation overflowed.            if newcap <= 0 {                newcap = cap            }        }    }    // ...}

依据以上代码能够整顿出如下扩容策略:

  • 如果新切片所需的最小容量大于以后切片容量的两倍,那么就间接用新切片所需的最小容量
  • 如果新切片所需的最小容量小于等于以后切片的容量的两倍

    • 如果以后切片的容量小于 1024 ,则间接把以后切片的容量翻倍作为新切片的容量
    • 如果以后切片的容量大于等于 1024 ,则每次递增切片容量的 1/4 倍,直到大于新切片所需的最小容量为止。

总结以上扩容策略,咱们能够用如下伪代码示意:

if NewCap > CurrCap * 2    return NewCapif CurrCap < 1024    return CurrCap * 2while CurrCap < NewCap    CurrCap += CurrCap / 4

第二局部:进行内存调配

当失去新切片的容量之后,最简略的形式就是间接向零碎申请 ElementTypeSize * NewSliceCap 的内存。但这么做不可避免的会产生很多的内存碎片,同时对高性能不敌对(在堆内存不足时,须要通过 brk 零碎调用扩大堆)。

Go 的内存治理

那咱们应该如何实现高性能的内存治理的同时缩小内存碎片的产生?咱们须要实现以下性能:

  • 内存池技术:一次从操作系统中申请大块内存,防止用户态到内核态的切换
  • 垃圾回收:动静、主动的垃圾回收机制让内存能够重复使用
  • 内存调配算法:能够实现高效的内存调配同时防止竞争和碎片化

Go 运行时的内存调配算法基于 TCMalloc 实现。该算法的核心思想就是将内存划分为多个不同的级别进行治理从而升高锁的粒度。具体的内存治理如何实现以及为何这么实现能够参考以下文章学习:

  • A visual guide to Go Memory Allocator from scratch (Golang)
  • Go: Memory Management and Allocation
  • Memory Management in Golang
  • Golang's memory allocation
  • Github: TCMalloc design
  • TCMalloc : Thread-Caching Malloc
  • 浅析Go内存治理架构
  • 图解Golang内存调配和垃圾回收

简略的说 Go 将小于 32K 字节的内存分为从 8B - 32K 等大概70种不同的规格(span)。如果申请的内存小于 32K 则间接向上取到某一个规格(可能会造成肯定的节约)。如果申请的内存大于 32K 则间接从 Go 持有的堆中按页(一个页面为 8K 字节)向上取整进行申请。

在切片扩容中的利用

接下来回到正题,看看内存治理是如何在切片扩容中利用的:

//// runtime/slice.go //// -- 为了便于剖析和展现, 代码通过删减 --func growslice(et *_type, old slice, cap int) slice {    // ...    var overflow bool    // lenmem    -> 以后切片元素所占用内存的大小    // newlenmem -> 在 append 之后切片元素所占用的内存大小    // capmem    -> 理论申请到的内存大小    var lenmem, newlenmem, capmem uintptr    // Specialize for common values of et.size.    // For 1 we don't need any division/multiplication.    // For sys.PtrSize, compiler will optimize division/multiplication into a shift by a constant.    // For powers of 2, use a variable shift.    switch {    case et.size == 1:        lenmem = uintptr(old.len)        newlenmem = uintptr(cap)        capmem = roundupsize(uintptr(newcap))        overflow = uintptr(newcap) > maxAlloc        newcap = int(capmem)    case et.size == sys.PtrSize:        lenmem = uintptr(old.len) * sys.PtrSize        newlenmem = uintptr(cap) * sys.PtrSize        capmem = roundupsize(uintptr(newcap) * sys.PtrSize)        overflow = uintptr(newcap) > maxAlloc/sys.PtrSize        newcap = int(capmem / sys.PtrSize)    case isPowerOfTwo(et.size):        var shift uintptr        if sys.PtrSize == 8 {            // Mask shift for better code generation.            shift = uintptr(sys.Ctz64(uint64(et.size))) & 63        } else {            shift = uintptr(sys.Ctz32(uint32(et.size))) & 31        }        lenmem = uintptr(old.len) << shift        newlenmem = uintptr(cap) << shift        capmem = roundupsize(uintptr(newcap) << shift)        overflow = uintptr(newcap) > (maxAlloc >> shift)        newcap = int(capmem >> shift)    default:        lenmem = uintptr(old.len) * et.size        newlenmem = uintptr(cap) * et.size        capmem, overflow = math.MulUintptr(et.size, uintptr(newcap))        capmem = roundupsize(capmem)        newcap = int(capmem / et.size)    }}

其实只有看 default 分支中的逻辑即可,其余分支只是依据元素类型的大小来做针对性的优化(通过移位等运算来少执行几个指令)。在这段代码中,决定最终申请多少内存的是 roundupsize 办法:

//// runtime/msize.go//// Malloc small size classes.//// See malloc.go for overview.// See also mksizeclasses.go for how we decide what size classes to use.// Returns size of the memory block that mallocgc will allocate if you ask for the size.func roundupsize(size uintptr) uintptr {    if size < _MaxSmallSize { // _MaxSmallSize = 32768        if size <= smallSizeMax-8 { // smallSizeMax = 1024            // smallSizeDiv = 8            return uintptr(class_to_size[size_to_class8[divRoundUp(size, smallSizeDiv)]])        } else {            // smallSizeMax = 1024, largeSizeDiv = 128            return uintptr(class_to_size[size_to_class128[divRoundUp(size-smallSizeMax, largeSizeDiv)]])        }    }    if size+_PageSize < size { // _PageSize = 8192        return size    }    return alignUp(size, _PageSize)}//// runtime/stubs.go//// divRoundUp returns ceil(n / a).func divRoundUp(n, a uintptr) uintptr {    // a is generally a power of two. This will get inlined and    // the compiler will optimize the division.    return (n + a - 1) / a}// alignUp rounds n up to a multiple of a. a must be a power of 2.func alignUp(n, a uintptr) uintptr {    return (n + a - 1) &^ (a - 1)}

该办法传入 size 参数计算自 NewSliceCap * ElementType.Size 。如果传入的 size 小于 32K 则会从以下规格中抉择一个「刚好能满足要求的规格」返回:

// 0 示意大对象(large object)var class_to_size = [_NumSizeClasses]uint16{ // _NumSizeClasses = 68        0,     8,    16,    24,    32,    48,    64,    80,    96,   112,       128,   144,   160,   176,   192,   208,   224,   240,   256,   288,       320,   352,   384,   416,   448,   480,   512,   576,   640,   704,       768,   896,  1024,  1152,  1280,  1408,  1536,  1792,  2048,  2304,      2688,  3072,  3200,  3456,  4096,  4864,  5376,  6144,  6528,  6784,      6912,  8192,  9472,  9728, 10240, 10880, 12288, 13568, 14336, 16384,     18432, 19072, 20480, 21760, 24576, 27264, 28672, 32768, }

如果申请的内存大于 32K 则会间接从堆中申请「刚好能满足的要求」的页(页大小为 8K)。相干内容能够参考以下源码:

  • runtime/malloc.go:内存治理相干的实现
  • runtime/mksizeclasses.go:生生以上规格的逻辑

第三局部:拷贝对象和返回

因为理论申请失去的内存容量可能会大于需要的容量,所以在确定申请内存的规格之后须要再次确定所申请到的内存规格到底能够包容多少元素。如下代码所示:

//// runtime/slice.go //// -- 为了便于剖析和展现, 代码通过删减 --func growslice(et *_type, old slice, cap int) slice {    // ...    capmem = roundupsize(capmem)    newcap = int(capmem / et.size)    // ...}

在扩容过程中无关内存大小的几个变量这里做个对立的解释:

  • lenmem:在 append 之前切片中所有元素所占用的内存大小(OldSlice.len * ElementTypeSize
  • newlenmem:在 append 之后切片中所有元素所占用内存大小((OldSlice.len + AppendSize) * ElementTypeSize
  • size:在 append 之后新切片的容量(第一局部计算失去)所须要的内存大小(NewSliceCap * ElementTypeSize
  • capmem:通过内存规格匹配之后理论申请到的内存大小(第二局部计算失去)

接下来就须要将数据从旧切片拷贝到新切片中,间接看代码:

//// runtime/slice.go //// -- 为了便于剖析和展现, 代码通过删减 --func growslice(et *_type, old slice, cap int) slice {    // ...    // p 指向申请到的内存的首地址    var p unsafe.Pointer    if et.ptrdata == 0 { // 如果元素类型中不蕴含指针        // 申请 capmem 个字节        p = mallocgc(capmem, nil, false)        // 因为可能会申请到大于需要容量的内存,所以须要将目前用不到的内存清零        // 在需要容量之内的内存会由之后的程序负责填充和赋值        memclrNoHeapPointers(add(p, newlenmem), capmem-newlenmem)    } else {        // 申请指定大小的内存并将所有内存清零        p = mallocgc(capmem, et, true)        // 为内存增加写屏障        if lenmem > 0 && writeBarrier.enabled {            // Only shade the pointers in old.array since we know the destination slice p            // only contains nil pointers because it has been cleared during alloc.            bulkBarrierPreWriteSrcOnly(uintptr(p), uintptr(old.array), lenmem-et.size+et.ptrdata)        }    }    // 将旧切片中的的数据拷贝过去,从 old.array 拷贝 lenmem 个字节到 p    memmove(p, old.array, lenmem)    // 返回新切片    return slice{p, old.len, newcap}}//// runtime/stubs.go// // memmove copies n bytes from "from" to "to".func memmove(to, from unsafe.Pointer, n uintptr)

至此,所有扩容相干的工作就完结了,接下来会由程序的其余局部将数据填充到刚刚扩容的切片中。这里咱们应用如下代码加上一张图来总结以上的所有内容,试试你能不能将以上各个局部的逻辑在图中对应起来。代码如下:

type Triangle [3]bytefunc main() {    s := []Triangle{{1, 1, 1}, {2, 2, 2}}    s = append(s, Triangle{3, 3, 3}, Triangle{4, 4, 4})    fmt.Printf("s = %v, len = %d, cap = %d\n", s, len(s), cap(s))    // s = [[1 1 1] [2 2 2] [3 3 3] [4 4 4]], len = 4, cap = 5}

依据以上代码,咱们能够画出如下的结构图(其中长方体示意一个 Triangle 类型,占用 3 个字节的空间):

验证切片扩容

纸上得来终觉浅,绝知此事要躬行。下面所剖析的内容毕竟只是实践和猜想,咱们须要通过实际来验证所总结的法则靠不靠谱。

小于 32K 的切片扩容

首先来试试在小于 32K 的切片上进行扩容,有如下代码:

func main() {    var s []int    s = append(s, 1, 2, 3, 4, 5)    fmt.Printf("s = %v, len = %d, cap = %d\n", s, len(s), cap(s))    // s = [1 2 3 4 5], len = 5, cap = 6    s = append(s, 6, 7, 8, 9)    fmt.Printf("s = %v, len = %d, cap = %d\n", s, len(s), cap(s))    // s = [1 2 3 4 5 6 7 8 9], len = 9, cap = 12}

咱们依照下面所总结的法则来一步步验证,有如下过程:

var s []int // s.data = null, s.len = 0, s.cap = 0s = append(s, 1, 2, 3, 4, 5)// 旧切片的容量有余,须要进行扩容// 执行扩容办法:growslice(et = type.int, old = {null, 0, 0}, cap = 5)//    1. 因为 cap > 2 * old.cap ,所以新切片的容量至多须要为 5 (NewSliceCap)//    2. 执行内存规格匹配,须要的内存容量为 5 * 8(int) = 40 字节,查表可得理论应用的内存规格为 48 字节//    3. 所以理论的切片容量为 48(capmem) / 8(et.size) = 6// 验证正确s = append(s, 6, 7, 8, 9)// 旧切片容量为 6 ,需要容量为 9 ,须要进行扩容// 执行扩容办法:growslice(et = type.int, old = {<addr>, 5, 6}, cap = 9)//    1. 因为 cap < 2 * old.cap = 12 且 old.cap < 1024 ,所以新切片的容量至多须要为 2 * old.cap = 12//    2. 执行内存规格匹配,须要的内存容量为 12 * 8(int) = 96 字节,查表可得理论应用的内存规格为 96 字节//    3. 所以理论的切片容量为 96(capmem) / 8(et.size) = 12// 验证正确

大于 32K 的切片扩容

咱们通过长度为 128 的字节数组(占用 1024 个字节)来逐渐验证大于 32K 的切片扩容:

type Array [128]int // 128 * 8 = 1024 Bytesfunc main() {    var s []Array    s = append(s, Array{}, Array{}, Array{}, Array{}, Array{}, Array{}, Array{}) // 7K    fmt.Printf("s, len = %d, cap = %d\n", len(s), cap(s))    // s, len = 7, cap = 8    s = append(s, make([]Array, 26)...) // 33K    fmt.Printf("s, len = %d, cap = %d\n", len(s), cap(s))    // s, len = 33, cap = 40}

同样,依照总结的法则进行推算,有如下过程:

var s []Array // s.data = null, s.len = 0, s.cap = 0s = append(s, Array{}, Array{}, Array{}, Array{}, Array{}, Array{}, Array{})// 旧切片的容量有余,须要进行扩容// 执行扩容办法:growslice(et = type.Array, old = {null, 0, 0}, cap = 7)//    1. 因为 cap > 2 * old.cap ,所以新切片的容量至多须要为 7 (NewSliceCap)//    2. 执行内存规格匹配,须要的内存容量为 7 * 1024(Array) = 7168 字节,查表可得理论应用的内存规格为 8192 字节//    3. 所以理论的切片容量为 8192(capmem) / 1024(et.size) = 8// 验证正确s = append(s, make([]Array, 26)...)// 旧切片容量为 8 ,需要容量为 33 ,须要进行扩容// 执行扩容办法:growslice(et = type.Array, old = {<addr>, 7, 8}, cap = 33)//    1. 因为 cap > 2 * old.cap = 16 ,所以新切片的容量至多须要为 cap = 33//    2. 执行内存规格匹配,须要的内存容量为 33 * 1024(int) = 33792 字节,因为大于 32768 ,按页向上取整失去 40960 字节//    3. 所以理论的切片容量为 40960(capmem) / 1024(et.size) = 40// 验证正确

到这里本文的所有内容就完结了,心愿你能有所播种。如有错漏望不吝赐教!

其余参考资料

以下是一些对于 Go 汇编的参考资料

  • What are the conditional jump instructions for Go's assembler?
  • Intel x86 JUMP quick reference
  • A Manual for the Plan 9 assembler