导读
Go源码版本1.13.8
明天要分享的是次要内容是Go语言Map底层实现
,目标让大家疾速理解Go语言Map
底层大抵的实现原理。读完本篇文章你能够取得收益、以及我所冀望你能获取的收益如下:
收益序号 | 收益形容 | 把握水平 |
---|---|---|
收益1 | 大抵对Go语言Map底层实现有一个理解 | 必须把握 |
收益2 | 大抵晓得Go语言Map是如何读取数据的 | 必须把握 |
收益3 | 相熟Go语言Map底层外围构造体hmap | 可选 |
收益4 | 相熟Go语言Map底层外围构造体bmap | 可选 |
收益5 | 相熟Go语言Map底层里的溢出桶 | 可选 |
收益6 | 相熟Go语言Map是如何读取数据的 | 可选 |
收益1和收益2是看了本篇文章心愿大家必须把握的知识点,其余的为可选项,如果你对此感兴趣或者曾经把握了收益1、2能够持续浏览此处的内容。
对于本篇文章的构造次要按如下程序发展:
- 简略看看个别Map的实现思路
- Go语言里Map的实现思路(入门水平:蕴含收益1、2)
- Go语言里Map的实现思路(相熟水平:蕴含收益3、4、5、6)
其次,本篇文章次要以Map的读来开展剖析,因为读弄明确了,其余的写、更新、删除等基本操作根本都能够猜出来了,不是么????。
简略看看个别Map的实现思路
直入主题,个别的Map会蕴含两个次要构造:
- 数组:数组里的值指向一个链表
- 链表:目标解决hash抵触的问题,并寄存键值
大抵构造如下:
读取一个key值的过程大抵如下:
key | v +------------------------------------+| key通过hash函数失去key的hash |+------------------+-----------------+ | v+------------------------------------+| key的hash通过取模或者位操作 || 失去key在数组上的索引 |+------------------------------------+ | v+------------------------------------+| 通过索引找到对应的链表 |+------------------+-----------------+ | v+------------------------------------+| 遍历链表比照key和指标key |+------------------+-----------------+ | v+------------------------------------+| 相等则返回value |+------------------+-----------------+ | v value
接着咱们来简略看看Go语言里Map的实现思路。
Go语言里Map的实现思路(入门水平)
蕴含收益1、2
Go语言解决hash抵触不是链表,理论次要用的数组(内存上的间断空间),如下图所示:
备注:前面咱们会解释下面为啥用的“次要”两个字。
然而并不是只应用一个数组(间断内存空间)寄存键和值,而是应用了两个数组别离存储键和值,图示如下:
上图中:
- 别离对应的是两个外围的构造体
hmap
和bmap
bmap
里有两个数组别离寄存key和value
把下面简化的关系转换一下,其实就是这样的一个大抵关系,如下图所示:
咱们通过一次读操作
为例,看看读取某个key的值的一个大抵过程:
步骤编号 | 形容 |
---|---|
① | 通过hash函数获取指标key的哈希,哈希和数组的长度通过位操作获取数组地位的索引(备注:获取索引值的形式个别有取模或位操作,位操作的性能好些) |
② | 遍历bmap里的键,和指标key比照获取key的索引(找不到则返回空值) |
③ | 依据key的索引通过计算偏移量,获取到对应value |
读过程图示如下:
这么看起来是不是“很简略”、很清晰,所以读到这里,你是不是曾经入门了Go语言Map底层实现
并且:
- 大抵对Go语言Map底层实现有一个理解(收益1)
- 大抵晓得Go语言Map是如何读取数据的(收益2)
然而理论状况不止如此,咱们再略微深刻的摸索下,有趣味的能够持续往下看,没趣味能够不必持续往下看了(开玩笑=^_^=),反正曾经达到目标了,哈哈????。
Go语言里Map的实现思路(相熟水平)
蕴含收益3、4、5、6
想要深刻学习,首先得理解下下面提到了实现Map的两个外围构造体hmap
和bmap
。
外围构造体hmap
收益3: 相熟Go语言Map底层外围构造体`hmap`
hmap
的构造其实刚开始看起来其实还是比较复杂的,有不少的字段,具体字段如下图所示:
字段释义如下:
字段 | 解释 |
---|---|
count | 键值对的数量 |
B | 2^B=len(buckets) |
hash0 | hash因子 |
buckets | 指向一个数组(间断内存空间),数组的类型为[]bmap,bmap类型就是存在键值对的构造上面会具体介绍,这个字段咱们能够称之为失常桶。如下图所示 |
oldbuckets | 扩容时,寄存之前的buckets(Map扩容相干字段) |
extra | 溢出桶构造,失常桶外面某个bmap存满了,会应用这外面的内存空间寄存键值对 |
noverflow | 溢出桶里bmap大抵的数量 |
nevacuate | 分流次数,成倍扩容分流操作计数的字段(Map扩容相干字段) |
flags | 状态标识,比方正在被写、buckets和oldbuckets在被遍历、等量扩容(Map扩容相干字段) |
备注:本次内容不波及Map的扩容逻辑。
重点看一些字段的含意和用途。
字段buckets
buckets
指向了一个数组(间断的内存空间),数组的元素是bmap
类型,这个字段咱们称之为失常桶。
hmap
的源码和地址如下:
// https://github.com/golang/go/blob/go1.13.8/src/runtime/map.gotype hmap struct { count int flags uint8 B uint8 noverflow uint16 hash0 uint32 buckets unsafe.Pointer oldbuckets unsafe.Pointer nevacuate uintptr extra *mapextra}
外围构造体bmap
收益4: Go语言Map底层外围构造体`bmap`
失常桶hmap.buckets
的元素是一个bmap
构造。bmap
的具体字段如下图所示:
字段释义如下:
字段 | 解释 |
---|---|
topbits | 长度为8的数组,[]uint8,元素为:key获取的hash的高8位,遍历时比照应用,进步性能。如下图所示 |
keys | 长度为8的数组,[]keytype,元素为:具体的key值。如下图所示 |
elems | 长度为8的数组,[]elemtype,元素为:键值对的key对应的值。如下图所示 |
overflow | 指向的hmap.extra.overflow 溢出桶里的bmap ,下面的字段topbits 、keys 、elems 长度为8,最多存8组键值对,存满了就往指向的这个bmap 里存 |
pad | 对齐内存应用的,不是每个bmap都有会这个字段,须要满足肯定条件 |
推断出bmap
构造字段的代码和地位如下:
// https://github.com/golang/go/blob/go1.13.8/src/cmd/compile/internal/gc/reflect.gofunc bmap(t *types.Type) *types.Type { // 略... field := make([]*types.Field, 0, 5) field = append(field, makefield("topbits", arr)) // 略... keys := makefield("keys", arr) field = append(field, keys) // 略... elems := makefield("elems", arr) field = append(field, elems) // 略... if int(elemtype.Align) > Widthptr || int(keytype.Align) > Widthptr { field = append(field, makefield("pad", types.Types[TUINTPTR])) } // 略... overflow := makefield("overflow", otyp) field = append(field, overflow) // 略...}
论断:每个bmap
构造最多寄存8组键值对。
hmap
和bmap
的根本构造合起来
别离理解了hmap
和bmap
的根本构造后,咱们把下面的内容合并起来,就失去如下的Map结构图:
溢出桶
收益5: 相熟Go语言Map底层里的溢出桶
下面讲bmap
的时候,咱们不是失去了个论断么“每个bmap
构造最多寄存8组键值对。”,所以问题来了:
失常桶里的bmap
存满了怎么办?
解决这个问题咱们就要说到hmap.extra
构造了,hmap.extra
是个构造体,构造图示和字段释义如下:
字段 | 解释 |
---|---|
overflow | 称之为溢出桶。和hmap.buckets 的类型一样也是数组[]bmap ,当失常桶bmap 存满了的时候就应用hmap.extra.overflow 的bmap 。所以这里有个问题失常桶hmap.buckets 里的bmap 是怎么关联上溢出桶hmap.extra.overflow 的bmap 呢?咱们上面说。 |
oldoverflow | 扩容时寄存之前的overflow(Map扩容相干字段) |
nextoverflow | 指向溢出桶里下一个能够应用的bmap |
源码和地址如下:
// https://github.com/golang/go/blob/go1.13.8/src/runtime/map.gotype mapextra struct { overflow *[]*bmap oldoverflow *[]*bmap nextOverflow *bmap}
问题:失常桶hmap.buckets
里的bmap
是怎么关联上溢出桶hmap.extra.overflow
的bmap
呢?
答:就是咱们介绍bmap
构造时里的bmap.overflow
字段(如下图所示)。bmap.overflow
是个指针类型,寄存了对应应用的溢出桶hmap.extra.overflow
里的bmap
的地址。
问题又来了:
问题:失常桶hmap.buckets
里的bmap
是什么时候关联上溢出桶hmap.extra.overflow
的bmap
呢?
答:Map写操作的时候。这里间接看要害代码:
// https://github.com/golang/go/blob/go1.13.8/src/runtime/map.gofunc mapassign(t *maptype, h *hmap, key unsafe.Pointer) unsafe.Pointer { // 略again: // 略... var inserti *uint8 // 略...bucketloop: for { for i := uintptr(0); i < bucketCnt; i++ { // key的hash高8位不相等 if b.tophash[i] != top { // 以后地位bmap.tophash的元素为空且还没有写入的记录(inserti曾经写入的标记为) if isEmpty(b.tophash[i]) && inserti == nil { // inserti赋值为以后的hash高8位 标记写入胜利 inserti = &b.tophash[i] // 略... } // 略... continue } // 略... goto done } // 失常桶的bmap遍历完了 持续遍历溢出桶的bmap 如果有的话 ovf := b.overflow(t) if ovf == nil { break } b = ovf } // 略... // 没写入胜利(蕴含失常桶的bmap、溢出桶的bmap(如果有的话)) if inserti == nil { // 调配新的bmap写 newb := h.newoverflow(t, b) // 略... } // 略...}// 持续看h.newoverflow的代码func (h *hmap) newoverflow(t *maptype, b *bmap) *bmap { var ovf *bmap // 如果hmap的存在溢出桶 且 溢出桶还没用完 if h.extra != nil && h.extra.nextOverflow != nil { // 应用溢出桶的bmap ovf = h.extra.nextOverflow // 判断桶的bmap的overflow是不是空 // 这里很奇妙。为啥? // 溢出桶初始化的时候会把最初一个bmap的overflow指向失常桶,值不为nil // 目标判断以后这个bmap是不是溢出桶里的最初一个 if ovf.overflow(t) == nil { // 是nil // 阐明不是最初一个 h.extra.nextOverflow = (*bmap)(add(unsafe.Pointer(ovf), uintptr(t.bucketsize))) } else { // 不是nil // 则重置以后bmap的overflow为空 ovf.setoverflow(t, nil) // 且 标记nextOverflow为nil 阐明以后溢出桶用完了 h.extra.nextOverflow = nil } } else { // 没有溢出桶 或者 溢出桶用完了 // 内存空间重新分配一个bmap ovf = (*bmap)(newobject(t.bucket)) } // 生成溢出桶bmap的计数器计数 h.incrnoverflow() // 略... // 这行代码就是下面问题咱们要的答案: // 失常桶`hmap.buckets`里的`bmap`在这里关联上溢出桶`hmap.extra.overflow`的`bmap` b.setoverflow(t, ovf) return ovf}// setoverflow函数的源码func (b *bmap) setoverflow(t *maptype, ovf *bmap) { // 这行代码的意思:通过偏移量计算找到了bmap.overflow,并把ovf这个bmap的地址赋值给了bmap.overflow *(**bmap)(add(unsafe.Pointer(b), uintptr(t.bucketsize)-sys.PtrSize)) = ovf}
上面代码这段代码解释了,下面的源码中为何如此判断预调配溢出桶的bmap
是最初一个的起因。
// https://github.com/golang/go/blob/go1.13.8/src/runtime/map.go// 创立hmap的失常桶func makeBucketArray(t *maptype, b uint8, dirtyalloc unsafe.Pointer) (buckets unsafe.Pointer, nextOverflow *bmap) { // 略... if base != nbuckets { // 略... last := (*bmap)(add(buckets, (nbuckets-1)*uintptr(t.bucketsize))) // 把溢出桶里 最初一个 `bmap`的`overflow`指先失常桶的第一个`bmap` // 获取预调配的溢出桶里`bmap`时,能够通过判断overflow是不是为nil判断是不是最初一个 last.setoverflow(t, (*bmap)(buckets)) } // 略...}
当hmap
存在溢出桶时,且以后溢出桶只被应用了一个bmap时,咱们能够失去如下的关系图:
同时咱们能够看出失常桶的bmap
和溢出桶的bmap
理论形成了链表关系,所以这也解释了开篇咱们说到的“Go外面Map的实现次要用到了数组”,其次还用到了链表。
再次剖析Map的读
收益6: 相熟Go语言Map是如何读取数据的
通过下面的学习,咱们再次通过一次读操作为例,看看读取某个key的值的一个大抵过程:
联合代码剖析下整个大体的过程:
func mapaccess1(t *maptype, h *hmap, key unsafe.Pointer) unsafe.Pointer { // ...略 // ①通过hash函数获取以后key的哈希 hash := alg.hash(key, uintptr(h.hash0)) m := bucketMask(h.B) // ②通过以后key的哈希获取到对应的bmap构造的b // 这里的b 咱们称之为“失常桶的bmap” // “失常桶的bmap”可能会对应到溢出桶的bmap构造,咱们称之为“溢出桶的bmap” b := (*bmap)(add(h.buckets, (hash&m)*uintptr(t.bucketsize))) // ...略 // 获取以后key的哈希的高8位 top := tophash(hash)bucketloop: // 上面的for循环是个简写,残缺如下。 // for b = b; b != nil; b = b.overflow(t) { // 能够晓得b的初始值为下面的“失常桶的bmap”,则: // 第一次遍历:遍历的是“失常桶的bmap” // 如果失常桶没找到,则 // 绿色线条④ 持续遍历:如果以后“失常桶的bmap”中的overflow值不为nil(阐明“失常桶的bmap”关联了“溢出桶的bmap”),则遍历以后指向的“溢出桶的bmap”持续 蓝色线条的③④⑤步骤 for ; b != nil; b = b.overflow(t) { // 因为b的初始值为“失常桶的bmap”,第一次先遍历“失常桶的bmap” for i := uintptr(0); i < bucketCnt; i++ { // 蓝色线条③ 比照key哈希的高8位 // 比照哈希的高8位目标是为了减速 if b.tophash[i] != top { // emptyRest 标记位:示意以后地位曾经是开端了;删除操作会设置此标记位 if b.tophash[i] == emptyRest { break bucketloop } continue } // 找到了雷同的hash高8位,则:找到对应索引地位i的key k := add(unsafe.Pointer(b), dataOffset+i*uintptr(t.keysize)) if t.indirectkey() { k = *((*unsafe.Pointer)(k)) } // 蓝色线条④ 比照key是不是统一 if alg.equal(key, k) { // 蓝色线条⑤ key是统一,则:获取对应索引地位的值 e := add(unsafe.Pointer(b), dataOffset+bucketCnt*uintptr(t.keysize)+i*uintptr(t.elemsize)) if t.indirectelem() { e = *((*unsafe.Pointer)(e)) } // 返回找到的后果 return e } } } // 失常桶、溢出桶都没找到则返回 “空值” return unsafe.Pointer(&zeroVal[0])}
参考:1.《Go语言设计与实现》https://draveness.me/golang/docs/part2-foundation/ch03-datastructure/golang-hashmap/2. Go源码版本1.13.8 https://github.com/golang/go/tree/go1.13.8/src
查看《Go语言轻松系列》更多内容
链接 http://tigerb.cn/go/#/kernal/