应用内存对齐机制优化结构体性能,妙啊!
前言
之前分享过2篇构造体文章:
10秒改struct性能间接晋升15%,产品姐姐都夸我好棒 和 Go语言空构造体这3种妙用,你晓得吗? 失去了大家的好评。
这篇持续分享进阶内容:
构造体的定义,大家都很相熟,想要定义出更节俭内存空间的构造体,可不是一件简略的事。
咱们必须把握Go的构造体内存对齐机制,能力做出相应的优化:节俭内存并进步性能。
先来看个例子
上面定义两个构造体,字段都一样,只是局部字段略微调整了一下程序。
但输入的后果却齐全不同:一个程序调整就节俭了8个字节,太神奇了。
type BadSt struct { A int32 B int64 C bool}type GoodSt struct { A int32 C bool B int64}func main() { bad := BadSt{A: 10, B: 20, C: false} fmt.Println(unsafe.Sizeof(bad))//输入后果:24 good := GoodSt{A: 10, B: 20, C: false} fmt.Println(unsafe.Sizeof(good))//输入后果:16}
为什么bad占用24字节,而good却只占用16字节呢?
想要解开这个问题,咱们得先来学习一下内存对齐机制,而后再来进一步剖析。
原理解说
基本概念
为了能让CPU能够更快的存储、读取到各个字段,Go编译器会帮咱们把构造体做数据的对齐。
所谓的数据对齐,是指内存地址的大小是所存储数据大小的整数倍(按字节为单位),以便CPU能够一次将该数据从内存中读取进去,缩小了读取次数。
编译器通过在构造体的各个字段之间填充一些空白,来达到对齐的目标。
CPU拜访内存
CPU 拜访内存时,并不是一一字节拜访,而是以机器字(word)为单位进行拜访。
比方 64位CPU的字长(word size)为8bytes,那么CPU拜访内存的单位也是8字节,每次加载的内存数据也是固定的若干字长,如8words(64bytes)、16words(128bytes)等
对齐系数
不同硬件平台占用的大小和对齐值都可能是不一样的,每个特定平台上的编译器都有本人的默认"对齐系数",32位零碎对齐系数是4,64位零碎对齐系数是8
不同类型的对齐系数也可能不一样,应用Go
语言中的unsafe.Alignof
函数能够返回相应类型的对齐系数,对齐系数都合乎2^n
这个法则,最大也不会超过8
func main() { fmt.Printf("bool: %d\n", unsafe.Alignof(bool(true))) fmt.Printf("string: %d\n", unsafe.Alignof(string("a"))) fmt.Printf("int: %d\n", unsafe.Alignof(int(0))) fmt.Printf("int32: %d\n", unsafe.Alignof(int32(0))) fmt.Printf("int64: %d\n", unsafe.Alignof(int64(0))) fmt.Printf("float64: %d\n", unsafe.Alignof(float64(0))) fmt.Printf("float32:%d\n", unsafe.Alignof(float32(0)))}//输入后果://bool: 1//string: 8//int: 8//int32: 4//int64: 8//float64:8//float32:4
对齐准则
- 构造体变量中成员的偏移量必须是成员大小的整数倍
- 整个构造体的内存大小必须是最大字节的整数倍(构造体的内存占用是1/4/8/16byte…)
案例剖析
type BadSt struct { A int32 B int64 C bool}
BadSt构造体,占用24个字节
剖析过程:
- 字段A 4字节:先计算偏移量,最结尾下标为0,0%4=0,正好整除,先占用4个字节;
- 字段B 8字节:下标4-7,对8都不能整除,则填充空白,下标8能够整除,所以下标8-15 8个字节为字段B的存储应用;
- 字段C 1字节:下标16,对1能够整除,所以下标16则用作字段C的存储;
- 最初,该构造体字段最大字节为8且目前已占用17字节,要保障是整数倍,所以最初面须要填充7个字节,占满24字节,能力满足条件(对齐准则2)。
- *
GoodSt构造体,占用16个字节
type GoodSt struct { A int32 C bool B int64}
剖析过程:
- 字段A 4字节:先计算偏移量,最结尾下标为0,0%4=0,正好整除,先占用4个字节;
- 字段C 1字节:下标4,对1能够整除,所以下标4则用作字段C的存储;
- 字段B 8字节:下标5-7,对8都不能整除,则填充空白,下标8能够整除,所以下标8-15 8个字节为字段B的存储应用;
- 最初,该构造体字段最大字节为8且目前已占用16字节,正好是整数倍,所以前面不再须要填充空白了。
总结
通过上文的原理解说和案例剖析,咱们发现内存对齐机制并不简单。
能够简略了解为:将对齐系数小的字段,尽可能放在一起,尽量减少空白填充。
把握了内存对齐机制后,构造体Struct的优化,调整下字段程序,成果空谷传声。内存对齐其实就是典型的空间换工夫的形式,来达到优化的目标。牢记对齐准则,对理论场景进行剖析,缩小空白填充。
一起学习
须要简历优化和就业辅导的敌人能够私信我,也欢送关注我的公众号:
我的文章首发在我的公众号: 程序员升职加薪之旅,欢送大家关注,第一工夫浏览我的文章。
也欢送大家关注我,点赞、留言、转发。你的反对,是我更文的最大能源!