共计 4889 个字符,预计需要花费 13 分钟才能阅读完成。
来做一个快速测验 - 以下代码输出什么?
vals := make([]int, 5)
for i := 0; i < 5; i++ {vals = append(vals, i)
}
fmt.Println(vals)
Run it on the Go Playground → https://play.golang.org/p/7Pg…
如果猜到了[0 0 0 0 0 0 1 2 3 4]
,那么你是正确的。等一下为什么不是[0 1 2 3 4]
?
如果答错了,也不担心。从其他语言过渡到 Go 时,这是一个相当普遍的错误,在本文中,我们将介绍为什么输出不符合你的预期以及如何利用 Go 的细微差别来提高代码效率。
Slices vs Arrays
在 Go 中,既有数组又有切片。切片和数组之间有很多区别,数组的长度是其类型的一部分,所以数组不能改变大小,而切片可以具有动态大小,因为切片是数组的包装。这是什么意思?假设我们有一个数组 var a [10]int
。此数组的大小固定,无法更改。如果我们调用len(a)
,它将始终返回 10,因为该大小 10 是该类型[10]int
的一部分。如果你在数组中需要 10 个以上的项,则必须创建一个类型完全不同的新对象,例如 var b [11] int,然后将所有值从 a 复制到 b。
虽然在特定情况下使用具有固定大小的数组很有价值,但通常来说这并不是开发人员想要的。相反,我们希望使用与 Go 中的数组类似的东西,但是具有随着时间增加长度的能力。一种简单的方法是创建一个比需要的数组大得多的数组,然后将该数组的子集当作使用的数组。下面的代码显示了一个示例。
var vals [20]int
for i := 0; i < 5; i++ {vals[i] = i * i
}
subsetLen := 5
fmt.Println("The subset of our array has a length of:", subsetLen)
// Add a new item to our array
vals[subsetLen] = 123
subsetLen++
fmt.Println("The subset of our array has a length of:", subsetLen)
Run it on the Go Playground → https://play.golang.org/p/Np6…
上面代码中,我们将一个数组其大小设置为 20,但是由于我们仅使用一个子集,因此我们的代码可以假装数组的长度为 5,然后在向数组中添加新项后为 6。
(很粗略地说)这就是切片的工作方式。它们包装一个具有设定大小的数组,就像上一个示例中的数组具有 20 的设定大小一样。它们还跟踪程序可使用的数组子集 -length
属性,它类似于上一示例中的 subsetLen
变量。
切片还具有一个容量,类似于上一个示例中数组(20)的总长度。这很有用,因为它告诉你子集可以增长多大之后才能不再适合支撑切片的底层数组。当发生这种情况时,将会分配一个新的数组来支撑切片,但是所有这些逻辑都隐藏在 append
函数的后面。
简而言之,将 slice
与append
函数结合在一起可以为我们提供一种与数组非常相似的类型,但是随着时间的增长,它可以处理更多元素。
让我们再次看一下前面的示例,但是这次我们将使用切片而不是数组。
var vals []int
for i := 0; i < 5; i++ {vals = append(vals, i)
fmt.Println("The length of our slice is:", len(vals))
fmt.Println("The capacity of our slice is:", cap(vals))
}
// Add a new item to our array
vals = append(vals, 123)
fmt.Println("The length of our slice is:", len(vals))
fmt.Println("The capacity of our slice is:", cap(vals))
// Accessing items is the same as an array
fmt.Println(vals[5])
fmt.Println(vals[2])
Run it on the Go Playground → https://play.golang.org/p/M_q…
我们仍然可以像访问数组一样访问切片中的元素,但是通过使用切片和 append
函数,我们不再需要考虑支持数组的大小。通过使用 len
和cap
函数,我们仍然可以弄清楚这些事情,但是我们不必太担心它们。
考虑到这一点,让我们回顾一下文章开头的测验代码,看看出了什么问题。
vals := make([]int, 5)
for i := 0; i < 5; i++ {vals = append(vals, i)
}
fmt.Println(vals)
调用 make
时,我们最多可以传入 3 个参数。第一个是我们要分配的类型,第二个是类型的长度,第三个是类型的容量(此参数是可选的)。
通过 make([] int, 5),我们告诉程序要创建一个长度为 5 的切片,并且容量默认为提供的长度 - 在这里是 5。虽然这看起来似乎是我们最初想要的,但这里的重要区别是我们告诉切片要将长度和容量都设置为 5,make 将切片初始化为 [0 ,0 ,0 ,0 ,0]
然后继续调用 append
函数,因此它将增加容量并在切片的末尾开始添加新元素。
如果在代码中添加 Println()
语句,可以看到容量的变化。
vals := make([]int, 5)
fmt.Println("Capacity was:", cap(vals))
for i := 0; i < 5; i++ {vals = append(vals, i)
fmt.Println("Capacity is now:", cap(vals))
}
fmt.Println(vals)
Run it on the Go Playground → https://play.golang.org/p/d6O…
结果,我们最终得到了输出 [0 0 0 0 0 0 0 1 2 3 4]
而不是期望的[0 1 2 3 4]
。我们该如何解决?嗯,有几种方法可以做到这一点,我们将介绍其中两种,你可以择最适合自己情况的一种。
不使用 append, 直接用索引写入
第一个解决方法是保持 make 调用不变,并明确声明要将每个元素设置为的索引。
vals := make([]int, 5)
for i := 0; i < 5; i++ {vals[i] = i
}
fmt.Println(vals)
Run it on the Go Playground → https://play.golang.org/p/JI8…
我们设置的值恰好与我们要使用的索引相同,但是您也可以独立跟踪索引。例如,如果您想获取 map 的 key,则可以使用以下代码:
package main
import "fmt"
func main() {fmt.Println(keys(map[string]struct{}{"dog": struct{}{},
"cat": struct{}{},
}))
}
func keys(m map[string]struct{}) []string {ret := make([]string, len(m))
i := 0
for key := range m {ret[i] = key
i++
}
return ret
}
Run it on the Go Playground → https://play.golang.org/p/kIK…
这之所以行之有效,是因为我们知道返回的切片的确切长度将与 map 的长度相同,因此我们可以使用该长度初始化切片,然后将每个元素分配给适当的索引。这种方法的缺点是我们必须跟踪i
,以便我们知道将每个值放入哪个索引。
这导致我们进入第二种方法
使用 0 作为长度,并指定容量
我们更新 make 调用,在切片类型之后为其提供两个参数。首先,新切片的长度将设置为 0,因此我们没有在切片中添加任何新元素。第二个参数是新切片的容量,将被设置为 map 参数的长度,因为我们知道切片最终的长度就是 map 的长度。
这仍将在幕后构造与上一个示例相同的数组,但是现在,当我们调用 append
时,它将知道将元素放置在切片的开头,因为切片的长度为 0。
package main
import "fmt"
func main() {fmt.Println(keys(map[string]struct{}{"dog": struct{}{},
"cat": struct{}{},
}))
}
func keys(m map[string]struct{}) []string {ret := make([]string, 0, len(m))
for key := range m {ret = append(ret, key)
}
return ret
}
Run it on the Go Playground → https://play.golang.org/p/h5h…
使用 append 能自动扩容,为什么还要关心切片的容量
你可能要问的下一件事是:“如果 append 函数可以为我增加切片的容量,我们为什么还要告诉程序一个容量?”
事实是,在大多数情况下,无需太担心这一点。如果它使您的代码复杂得多,只需使用 var vals []int
初始化切片,然后让 append
函数处理繁重的工作。但是针对知道切片最终长度的情况,我们可以在初始化切片时声明其容量,从而使程序不必执行不必要的内存分配。
请在 Go Playground 上运行以下代码。每当容量增加时,我们的程序就需要执行另一次内存分配:
package main
import "fmt"
func main() {fmt.Println(keys(map[string]struct{}{"dog": struct{}{},
"cat": struct{}{},
"mouse": struct{}{},
"wolf": struct{}{},
"alligator": struct{}{},
}))
}
func keys(m map[string]struct{}) []string {var ret []string
fmt.Println(cap(ret))
for key := range m {ret = append(ret, key)
fmt.Println(cap(ret))
}
return ret
}
Run it on the Go Playground → https://play.golang.org/p/fDb…
现在将切片预设容量后将其与上面相同的代码进行比较:
package main
import "fmt"
func main() {fmt.Println(keys(map[string]struct{}{"dog": struct{}{},
"cat": struct{}{},
"mouse": struct{}{},
"wolf": struct{}{},
"alligator": struct{}{},
}))
}
func keys(m map[string]struct{}) []string {ret := make([]string, 0, len(m))
fmt.Println(cap(ret))
for key := range m {ret = append(ret, key)
fmt.Println(cap(ret))
}
return ret
}
Run it on the Go Playground → https://play.golang.org/p/nwT…
在第一个代码示例中,我们的容量从 0 开始,然后增加到 1、2、4,最后是 8,这意味着我们必须在 5 个不同的时间分配一个新数组,此外,最后一个数组用于支持我们 slice
的容量为 8,大于我们最终需要的容量。另一方面,我们的第二个示例以相同的容量(5)开始和结束,并且只需要在 keys()
函数开始时分配一次即可。我们还避免浪费任何额外的内存。
不要过度优化
通常不鼓励任何人担心像这样的次要优化,但是在确实很明显最终大小应该是多少的情况下,强烈建议为切片设置适当的容量或长度。
它不仅有助于提高应用程序的性能,而且还可以通过明确说明输入大小和输出大小之间的关系来帮助理清代码。
本文并不是要对切片或数组之间的差异进行详尽的讨论,而只是要简要介绍容量和长度如何影响切片以及它们在不同解决方案中的作用。