关于后端:面试官请说一下如何优化结构体的性能

应用内存对齐机制优化结构体性能，妙啊！

前言

之前分享过2篇构造体文章：
10秒改struct性能间接晋升15%，产品姐姐都夸我好棒和 Go语言空构造体这3种妙用，你晓得吗？失去了大家的好评。

这篇持续分享进阶内容：

构造体的定义，大家都很相熟，想要定义出更节俭内存空间的构造体，可不是一件简略的事。

咱们必须把握Go的构造体内存对齐机制，能力做出相应的优化：节俭内存并进步性能。

先来看个例子

上面定义两个构造体，字段都一样，只是局部字段略微调整了一下程序。

但输入的后果却齐全不同：一个程序调整就节俭了8个字节，太神奇了。

type BadSt struct {
  A int32
  B int64
  C bool
}

type GoodSt struct {
  A int32
  C bool
  B int64
}

func main() {
  bad := BadSt{A: 10, B: 20, C: false}
  fmt.Println(unsafe.Sizeof(bad))//输入后果：24
  good := GoodSt{A: 10, B: 20, C: false}
  fmt.Println(unsafe.Sizeof(good))//输入后果：16
}

为什么bad占用24字节，而good却只占用16字节呢？

想要解开这个问题，咱们得先来学习一下内存对齐机制，而后再来进一步剖析。

原理解说

基本概念

为了能让CPU能够更快的存储、读取到各个字段，Go编译器会帮咱们把构造体做数据的对齐。

所谓的数据对齐，是指内存地址的大小是所存储数据大小的整数倍（按字节为单位），以便CPU能够一次将该数据从内存中读取进去，缩小了读取次数。

编译器通过在构造体的各个字段之间填充一些空白，来达到对齐的目标。

CPU拜访内存

CPU 拜访内存时，并不是一一字节拜访，而是以机器字（word）为单位进行拜访。

比方 64位CPU的字长（word size）为8bytes，那么CPU拜访内存的单位也是8字节，每次加载的内存数据也是固定的若干字长，如8words（64bytes）、16words(128bytes）等

对齐系数

不同硬件平台占用的大小和对齐值都可能是不一样的，每个特定平台上的编译器都有本人的默认”对齐系数”，32位零碎对齐系数是4，64位零碎对齐系数是8

不同类型的对齐系数也可能不一样，应用Go语言中的unsafe.Alignof函数能够返回相应类型的对齐系数，对齐系数都合乎2^n这个法则，最大也不会超过8

func main() {
  fmt.Printf("bool:   %d\n", unsafe.Alignof(bool(true)))
  fmt.Printf("string: %d\n", unsafe.Alignof(string("a")))
  fmt.Printf("int:    %d\n", unsafe.Alignof(int(0)))
  fmt.Printf("int32:  %d\n", unsafe.Alignof(int32(0)))
  fmt.Printf("int64:  %d\n", unsafe.Alignof(int64(0)))
  fmt.Printf("float64:  %d\n", unsafe.Alignof(float64(0)))
  fmt.Printf("float32:%d\n", unsafe.Alignof(float32(0)))
}
//输入后果：
//bool:   1
//string: 8
//int:    8
//int32:  4
//int64:  8
//float64:8
//float32:4

对齐准则

构造体变量中成员的偏移量必须是成员大小的整数倍
整个构造体的内存大小必须是最大字节的整数倍（构造体的内存占用是1/4/8/16byte…)

案例剖析

type BadSt struct {
  A int32
  B int64
  C bool
}

BadSt构造体，占用24个字节

剖析过程：

字段A 4字节：先计算偏移量，最结尾下标为0，0%4=0，正好整除，先占用4个字节；
字段B 8字节：下标4-7，对8都不能整除，则填充空白，下标8能够整除，所以下标8-15 8个字节为字段B的存储应用；
字段C 1字节：下标16，对1能够整除，所以下标16则用作字段C的存储；
最初，该构造体字段最大字节为8且目前已占用17字节，要保障是整数倍，所以最初面须要填充7个字节，占满24字节，能力满足条件（对齐准则2）。

GoodSt构造体，占用16个字节

type GoodSt struct {
  A int32
  C bool
  B int64
}

剖析过程：

字段A 4字节：先计算偏移量，最结尾下标为0，0%4=0，正好整除，先占用4个字节；
字段C 1字节：下标4，对1能够整除，所以下标4则用作字段C的存储；
字段B 8字节：下标5-7，对8都不能整除，则填充空白，下标8能够整除，所以下标8-15 8个字节为字段B的存储应用；
最初，该构造体字段最大字节为8且目前已占用16字节，正好是整数倍，所以前面不再须要填充空白了。

总结

通过上文的原理解说和案例剖析，咱们发现内存对齐机制并不简单。

能够简略了解为：将对齐系数小的字段，尽可能放在一起，尽量减少空白填充。

把握了内存对齐机制后，构造体Struct的优化，调整下字段程序，成果空谷传声。内存对齐其实就是典型的空间换工夫的形式，来达到优化的目标。牢记对齐准则，对理论场景进行剖析，缩小空白填充。

一起学习

须要简历优化和就业辅导的敌人能够私信我，也欢送关注我的公众号：

我的文章首发在我的公众号：程序员升职加薪之旅，欢送大家关注，第一工夫浏览我的文章。

也欢送大家关注我，点赞、留言、转发。你的反对，是我更文的最大能源！

关于后端:面试官请说一下如何优化结构体的性能

前言

先来看个例子

原理解说

基本概念

CPU拜访内存

对齐系数

对齐准则

案例剖析

BadSt构造体，占用24个字节

GoodSt构造体，占用16个字节

总结

一起学习

评论

发表回复取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

关于后端:面试官请说一下如何优化结构体的性能

前言

先来看个例子

原理解说

基本概念

CPU拜访内存

对齐系数

对齐准则

案例剖析

BadSt构造体，占用24个字节

GoodSt构造体，占用16个字节

总结

一起学习

评论

发表回复 取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

发表回复取消回复