关于后端:面试官请说一下如何优化结构体的性能

54次阅读

共计 2262 个字符,预计需要花费 6 分钟才能阅读完成。

应用内存对齐机制优化结构体性能,妙啊!

前言

之前分享过 2 篇构造体文章:
10 秒改 struct 性能间接晋升 15%,产品姐姐都夸我好棒 和 Go 语言空构造体这 3 种妙用,你晓得吗?失去了大家的好评。

这篇持续分享进阶内容:

构造体的定义,大家都很相熟,想要定义出更节俭内存空间的构造体,可不是一件简略的事。

咱们必须把握 Go 的构造体内存对齐机制,能力做出相应的优化: 节俭内存并进步性能。

先来看个例子

上面定义两个构造体,字段都一样,只是局部字段略微调整了一下程序。

但输入的后果却齐全不同:一个程序调整就节俭了 8 个字节,太神奇了。

type BadSt struct {
  A int32
  B int64
  C bool
}

type GoodSt struct {
  A int32
  C bool
  B int64
}

func main() {bad := BadSt{A: 10, B: 20, C: false}
  fmt.Println(unsafe.Sizeof(bad))// 输入后果:24
  good := GoodSt{A: 10, B: 20, C: false}
  fmt.Println(unsafe.Sizeof(good))// 输入后果:16
}

为什么 bad 占用 24 字节,而 good 却只占用 16 字节呢

想要解开这个问题,咱们得先来学习一下内存对齐机制,而后再来进一步剖析。

原理解说

基本概念

为了能让 CPU 能够更快的存储、读取到各个字段,Go 编译器会帮咱们把构造体做数据的对齐。

所谓的数据对齐,是指内存地址的大小是所存储数据大小的整数倍(按字节为单位),以便 CPU 能够一次将该数据从内存中读取进去,缩小了读取次数。

编译器通过在构造体的各个字段之间填充一些空白,来达到对齐的目标

CPU 拜访内存

CPU 拜访内存时,并不是一一字节拜访,而是 以机器字(word)为单位进行拜访

比方 64 位 CPU 的字长(word size)为 8bytes,那么 CPU 拜访内存的单位也是 8 字节,每次加载的内存数据也是固定的若干字长,如 8words(64bytes)、16words(128bytes)等

对齐系数

不同硬件平台占用的大小和对齐值都可能是不一样的,每个特定平台上的编译器都有本人的默认 ” 对齐系数 ”,32 位零碎对齐系数是 4,64 位零碎对齐系数是 8

不同类型的对齐系数也可能不一样,应用 Go 语言中的 unsafe.Alignof 函数能够返回相应类型的对齐系数,对齐系数都合乎 2^n 这个法则,最大也不会超过 8

func main() {fmt.Printf("bool:   %d\n", unsafe.Alignof(bool(true)))
  fmt.Printf("string: %d\n", unsafe.Alignof(string("a")))
  fmt.Printf("int:    %d\n", unsafe.Alignof(int(0)))
  fmt.Printf("int32:  %d\n", unsafe.Alignof(int32(0)))
  fmt.Printf("int64:  %d\n", unsafe.Alignof(int64(0)))
  fmt.Printf("float64:  %d\n", unsafe.Alignof(float64(0)))
  fmt.Printf("float32:%d\n", unsafe.Alignof(float32(0)))
}
// 输入后果://bool:   1
//string: 8
//int:    8
//int32:  4
//int64:  8
//float64:8
//float32:4

对齐准则

  1. 构造体变量中成员的 偏移量必须是成员大小的整数倍
  2. 整个构造体的内存大小必须是最大字节的整数倍(构造体的内存占用是 1 /4/8/16byte…)

案例剖析

type BadSt struct {
  A int32
  B int64
  C bool
}

BadSt 构造体,占用 24 个字节

剖析过程:

  1. 字段 A 4 字节:先计算偏移量,最结尾下标为 0,0%4=0,正好整除,先占用 4 个字节;
  2. 字段 B 8 字节:下标 4 -7,对 8 都不能整除,则填充空白,下标 8 能够整除,所以下标 8 -15 8 个字节为字段 B 的存储应用;
  3. 字段 C 1 字节:下标 16,对 1 能够整除,所以下标 16 则用作字段 C 的存储;
  4. 最初,该构造体字段最大字节为 8 且目前已占用 17 字节,要保障是整数倍,所以最初面须要填充 7 个字节,占满 24 字节,能力满足条件(对齐准则 2)。
    • *

GoodSt 构造体,占用 16 个字节

type GoodSt struct {
  A int32
  C bool
  B int64
}

剖析过程:

  1. 字段 A 4 字节:先计算偏移量,最结尾下标为 0,0%4=0,正好整除,先占用 4 个字节;
  2. 字段 C 1 字节:下标 4,对 1 能够整除,所以下标 4 则用作字段 C 的存储;
  3. 字段 B 8 字节:下标 5 -7,对 8 都不能整除,则填充空白,下标 8 能够整除,所以下标 8 -15 8 个字节为字段 B 的存储应用;
  4. 最初,该构造体字段最大字节为 8 且目前已占用 16 字节,正好是整数倍,所以前面不再须要填充空白了。

总结

通过上文的原理解说和案例剖析,咱们发现内存对齐机制并不简单。

能够简略了解为:将对齐系数小的字段,尽可能放在一起,尽量减少空白填充。

把握了内存对齐机制后,构造体 Struct 的优化,调整下字段程序,成果空谷传声。内存对齐其实就是典型的空间换工夫的形式,来达到优化的目标。牢记对齐准则,对理论场景进行剖析,缩小空白填充

一起学习

须要简历优化和就业辅导的敌人能够私信我,也欢送关注我的公众号:

我的文章首发在我的公众号:程序员升职加薪之旅,欢送大家关注,第一工夫浏览我的文章。

也欢送大家关注我,点赞、留言、转发。你的反对,是我更文的最大能源!

正文完
 0