乐趣区

关于golang:不懂汇编也能看懂的-Go-interface-原理一

hi, 大家好,我是 haohognfan。

可能你看过的 interface 分析的文章比拟多了,这些文章根本都是从汇编角度剖析类型转换或者动静转发。不过随着 Go 版本升级,对应的 Go 汇编也产生了微小的变动,如果单从汇编角度去剖析 interface 变的十分有难度,本篇文章我会从 内度调配 + 汇编 角度切入 interface,去理解 interface 的原理。

限于篇幅 interface 无关动静转发和反射的内容,请关注后续的文章。本篇文章次要是对于类型转换,以及相干的容易呈现谬误的中央。

eface

func main() {var ti interface{}
      var a int = 100
      ti = a
      fmt.Println(ti)
}

这段最常见的代码,当初提出一些问题:

  • 如何查看 ti 是 eface 还是 iface ?
  • 值 100 保留在哪里了?
  • 如何看 ti 的实在的值的类型?

大部分源码剖析都是从汇编动手来看的,这里也把对应的汇编贴出来

0x0040 00064 (main.go:44)    MOVQ    $100, (SP)
0x0048 00072 (main.go:44)    CALL    runtime.convT64(SB)
0x004d 00077 (main.go:44)    MOVQ    8(SP), AX
0x0052 00082 (main.go:44)    MOVQ    AX, ""..autotmp_3+64(SP)
0x0057 00087 (main.go:44)    LEAQ    type.int(SB), CX
0x005e 00094 (main.go:44)    MOVQ    CX, "".ti+72(SP)
0x0063 00099 (main.go:44)    MOVQ    AX, "".ti+80(SP)

这段汇编有上面这些特点:

  • CALL runtime.convT64(SB):将 100 作为 runtime.convT64 的参数,该函数申请了一段内存,将 100 放入了这段内存里
  • 将类型 type.int 放入到 SP+72 的地位
  • 将蕴含 100 的那块内存的指针,放入到 SP + 80 的地位

这段汇编从直观上来说,interface 转换成 eface 是看不出来的。这个如何察看呢?这个就须要借助 gdb 了。

再持续深究下,如何利用内存散布来验证是 eface 呢?须要另外再增加点代码。

type eface struct {
    _type *_type
    data  unsafe.Pointer
}

type _type struct {
    size       uintptr
    ptrdata    uintptr // size of memory prefix holding all pointers
    hash       uint32
    tflag      tflag
    align      uint8
    fieldAlign uint8
    kind       uint8
    equal      func(unsafe.Pointer, unsafe.Pointer) bool
    gcdata     *byte
    str        nameOff
    ptrToThis  typeOff
}

func main() {var ti interface{}
    var a int = 100
    ti = a

    fmt.Println("type:", *(*eface)(unsafe.Pointer(&ti))._type)
    fmt.Println("data:", *(*int)((*eface)(unsafe.Pointer(&ti)).data))
    fmt.Println((*eface)(unsafe.Pointer(&ti)))
}

output:

type: {8 0 4149441018 15 8 8 2 0x10032e0 0x10e6b60 959 27232}
data: 100
&{0x10ade20 0x1155bc0}

从这个后果上可能看进去

  • eface.kind = 2, 对应着 runtime.kindInt
  • eface.data = 100

从内存上调配上看,咱们根本看进去了 eface 的内存布局及对应的最终的 eface 的类型转换后果。

iface

package main

type Person interface {Say() string
}

type Man struct {
}

func (m *Man) Say() string {return "Man"}

func main() {
    var p Person

    m := &Man{}
    p = m
    println(p.Say())
}

iface 咱们也看下汇编:

0x0029 00041 (main.go:24)    LEAQ    runtime.zerobase(SB), AX
0x0030 00048 (main.go:24)    MOVQ    AX, ""..autotmp_6+48(SP)
0x0035 00053 (main.go:24)    MOVQ    AX, "".m+32(SP)
0x003a 00058 (main.go:25)    MOVQ    AX, ""..autotmp_3+64(SP)
0x003f 00063 (main.go:25)    LEAQ    go.itab.*"".Man,"".Person(SB), CX
0x0046 00070 (main.go:25)    MOVQ    CX, "".p+72(SP)
0x004b 00075 (main.go:25)    MOVQ    AX, "".p+80(SP)

这段汇编上,可能看进去是有 itab 的,然而是否真的是转成了 iface,汇编上依然反馈不进去。

同样,咱们持续用 gdb 查看 Person interface 的确被转换成了 iface。

对于 iface 内存布局,咱们依然加点代码来查看

type itab struct {
    inter *interfacetype
    _type *_type
    hash  uint32
    _     [4]byte
    fun   [1]uintptr
}

type iface struct {
    tab  *itab
    data unsafe.Pointer
}

type Person interface {Say() string
}

type Man struct {Name string}

func (m *Man) Say() string {return "Man"}

func main() {
    var p Person

    m := &Man{Name: "hhf"}
    p = m
    println(p.Say())

    fmt.Println("itab:", *(*iface)(unsafe.Pointer(&p)).tab)
    fmt.Println("data:", *(*Man)((*iface)(unsafe.Pointer(&p)).data))
}

output:

Man
itab: {0x10b3ba0 0x10b1900 1224794265 [0 0 0 0] [17445152]}
data: {hhf}

对于想持续探索 eface, iface 的内存布局的同学,能够基于下面的代码,利用 unsafe 的相干函数去看对应的内存地位上的值。

类型断言

type Person interface {Say() string
}

type Man struct {Name string}

func (m *Man) Say() string {return "Man"}

func main() {
      var p Person

    m := &Man{Name: "hhf"}
    p = m

    if m1, ok := p.(*Man); ok {fmt.Println(m1.Name)
    }
}

咱们仅关注类型断言那块内容,贴出对应的汇编

0x0087 00135 (main.go:23)    MOVQ    "".p+104(SP), AX
0x008c 00140 (main.go:23)    MOVQ    "".p+112(SP), CX
0x0091 00145 (main.go:23)    LEAQ    go.itab.*"".Man,"".Person(SB), DX
0x0098 00152 (main.go:23)    CMPQ    DX, AX

可能看进去的是:将 iface.itab 放入了 AX,将 go.itab.*"".Man,"".Person(SB) 放入了 DX,比拟两者是否相等,来判断 Person 的实在类型是否是 Man。

另外一个类型断言的形式就是 switch 了,其实两者实质上没啥区别。

interface 最驰名的坑的,应该就是上面这个了。

func main() {var a interface{} = nil
    var b *int = nil
    
    isNil(a)
    isNil(b)
}

func isNil(x interface{}) {
    if x == nil {fmt.Println("empty interface")
      return
    }
    fmt.Println("non-empty interface")
}

output:

empty interface
non-empty interface

为什么会这样呢?这就波及到 interface == nil 的判断形式了。个别状况只有 eface 的 type 和 data 都为 nil 时,interface == nil 才是 true。

当咱们把 b 复制给 interface 时,x.\_type.Kind = kindPtr。虽说 x.data = nil,然而不合乎 interface == nil 的判断条件了。

对于 interface 源码浏览的一点倡议

对于 interface 源码浏览的一点倡议,如果想利用汇编看源码的话,尽量抉择 go1.14.x。

抉择 Go 汇编来看 interface,基本上也是为了查看 interface 最终被转换成 eface 还是 iface,调用了 runtime 的哪些函数,以及对应的函数栈散布。如果 Go 版本抉择的太高的话,go 汇编变动太大了,可能汇编上就看不到对应的内容了。

退出移动版