共计 6651 个字符,预计需要花费 17 分钟才能阅读完成。
这是一片关于 stackoverflow 热门问题的文章 How to efficiently concatenate strings
Go 里面 string 是最基础的类型, 是一个只读类型, 针对他的每一个操作都会创建一个新的 string
所以, 如果我在不知道结果是多少长字符串的情况下不断的连接字符串, 怎么样的方式是最好的呢?
1. 方法一: 使用 strings.Builder
从 Go 1.10(2018)版本开始可以使用 strings.Builder,
A Builder is used to efficiently build a string using Write methods. It minimizes memory copying.
The zero value is ready to use. Do not copy a non-zero Builder.
strings.Builder
使用 Write
方法来高效的构造字符串. 它使用内存最小, 它使用零值, 它不拷贝零值.
注意:不要拷贝 strings.Builder 的值, 如果你要使用 strings.Builder 值请使用 pointer
使用方法, 代码如下:
package main
import (
"strings"
"fmt"
)
func main() {
var str strings.Builder
for i := 0; i < 1000; i++ {str.WriteString("a")
}
fmt.Println(str.String())
}
2. 方法二: 使用 bytes.Buffer
在 201X 年之前使用 bytes
包的 Buffer
它实现了 io.Writer
的接口, 使用他来拼接字符串. 他的事件复杂度O(n)
.
package main
import (
"bytes"
"fmt"
)
func main() {
var buffer bytes.Buffer
for i := 0; i < 1000; i++ {buffer.WriteString("a")
}
fmt.Println(buffer.String())
}
3. 方法三: 使用 go 语言内置函数 copy
Go 内建函数 copy:func copy(dst, src []Type) int
,
用于将源 slice 的数据(第二个参数), 复制到目标 slice(第一个参数).
返回值为拷贝了的数据个数, 是 len(dst)和 len(src)中的最小值.
package main
import (
"bytes"
"fmt"
)
func main() {bs := make([]byte, 1000)
bl := 0
for n := 0; n < 1000; n++ {bl += copy(bs[bl:], "a")
}
fmt.Println(string(bs))
}
4. 方法四: 使用 go 语言内置函数 append
append 主要用于给某个切片(slice)追加元素,
如果该切片存储空间(cap)足够,就直接追加,长度(len)变长;如果空间不足,就会重新开辟内存,并将之前的元素和新的元素一同拷贝进去,
第一个参数为切片,后面是该切片存储元素类型的可变参数,
package main
import (
"bytes"
"fmt"
)
func main() {bs := make([]byte, 1000)
for n := 0; n < 1000; n++ {bs = append(bs,'a')
}
fmt.Println(string(bs))
}
5. 方法五: 使用字符串 + 运算
package main
import ("fmt")
func main() {
var result string
for i := 0; i < 1000; i++ {result += "a"}
fmt.Println(result)
}
6. 方法六: strings.Repeat
strings.Repeat 将 count 个字符串 s 连接成一个新的字符串
package main
import (
"fmt"
"strings"
)
func main() {fmt.Println(strings.Repeat("x",1000))
}
strings.Repeat 它的底层调用的是 strings.Builder, 提前分配了内存.
// Repeat returns a new string consisting of count copies of the string s.
//
// It panics if count is negative or if
// the result of (len(s) * count) overflows.
func Repeat(s string, count int) string {
if count == 0 {return ""}
// Since we cannot return an error on overflow,
// we should panic if the repeat will generate
// an overflow.
// See Issue golang.org/issue/16237
if count < 0 {panic("strings: negative Repeat count")
} else if len(s)*count/count != len(s) {panic("strings: Repeat count causes overflow")
}
n := len(s) * count
var b Builder
b.Grow(n)
b.WriteString(s)
for b.Len() < n {if b.Len() <= n/2 {b.WriteString(b.String())
} else {b.WriteString(b.String()[:n-b.Len()])
break
}
}
return b.String()}
7. Benchmark
string_benchmark.go
package main
import (
"bytes"
"strings"
"testing"
)
const (
sss = "https://mojotv.cn"
cnt = 10000
)
var (bbb = []byte(sss)
expected = strings.Repeat(sss, cnt)
)
// 使用 提前初始化 内置 copy 函数
func BenchmarkCopyPreAllocate(b *testing.B) {
var result string
for n := 0; n < b.N; n++ {bs := make([]byte, cnt*len(sss))
bl := 0
for i := 0; i < cnt; i++ {bl += copy(bs[bl:], sss)
}
result = string(bs)
}
b.StopTimer()
if result != expected {b.Errorf("unexpected result; got=%s, want=%s", string(result), expected)
}
}
// 使用 提前初始化 内置 append 函数
func BenchmarkAppendPreAllocate(b *testing.B) {
var result string
for n := 0; n < b.N; n++ {data := make([]byte, 0, cnt*len(sss))
for i := 0; i < cnt; i++ {data = append(data, sss...)
}
result = string(data)
}
b.StopTimer()
if result != expected {b.Errorf("unexpected result; got=%s, want=%s", string(result), expected)
}
}
// 使用 提前初始化 bytes.Buffer
func BenchmarkBufferPreAllocate(b *testing.B) {
var result string
for n := 0; n < b.N; n++ {buf := bytes.NewBuffer(make([]byte, 0, cnt*len(sss)))
for i := 0; i < cnt; i++ {buf.WriteString(sss)
}
result = buf.String()}
b.StopTimer()
if result != expected {b.Errorf("unexpected result; got=%s, want=%s", string(result), expected)
}
}
// 使用 strings.Repeat 本质是 pre allocate + strings.Builder
func BenchmarkStringRepeat(b *testing.B) {
var result string
for n := 0; n < b.N; n++ {result = strings.Repeat(sss,cnt)
}
b.StopTimer()
if result != expected {b.Errorf("unexpected result; got=%s, want=%s", string(result), expected)
}
}
// 使用 内置 copy
func BenchmarkCopy(b *testing.B) {
var result string
for n := 0; n < b.N; n++ {data := make([]byte, 0, 64) // same size as bootstrap array of bytes.Buffer
for i := 0; i < cnt; i++ {off := len(data)
if off+len(sss) > cap(data) {temp := make([]byte, 2*cap(data)+len(sss))
copy(temp, data)
data = temp
}
data = data[0 : off+len(sss)]
copy(data[off:], sss)
}
result = string(data)
}
b.StopTimer()
if result != expected {b.Errorf("unexpected result; got=%s, want=%s", string(result), expected)
}
}
// 使用 内置 append
func BenchmarkAppend(b *testing.B) {
var result string
for n := 0; n < b.N; n++ {data := make([]byte, 0, 64)
for i := 0; i < cnt; i++ {data = append(data, sss...)
}
result = string(data)
}
b.StopTimer()
if result != expected {b.Errorf("unexpected result; got=%s, want=%s", string(result), expected)
}
}
// 使用 bytes.Buffer
func BenchmarkBufferWriteBytes(b *testing.B) {
var result string
for n := 0; n < b.N; n++ {
var buf bytes.Buffer
for i := 0; i < cnt; i++ {buf.Write(bbb)
}
result = buf.String()}
b.StopTimer()
if result != expected {b.Errorf("unexpected result; got=%s, want=%s", string(result), expected)
}
}
// 使用 strings.Builder write bytes
func BenchmarkStringBuilderWriteBytes(b *testing.B) {
var result string
for n := 0; n < b.N; n++ {
var buf strings.Builder
for i := 0; i < cnt; i++ {buf.Write(bbb)
}
result = buf.String()}
b.StopTimer()
if result != expected {b.Errorf("unexpected result; got=%s, want=%s", string(result), expected)
}
}
// 使用 string buffer write string
func BenchmarkBufferWriteString(b *testing.B) {
var result string
for n := 0; n < b.N; n++ {
var buf bytes.Buffer
for i := 0; i < cnt; i++ {buf.WriteString(sss)
}
result = buf.String()}
b.StopTimer()
if result != expected {b.Errorf("unexpected result; got=%s, want=%s", string(result), expected)
}
}
// 使用 string 加号
func BenchmarkStringPlusOperator(b *testing.B) {
var result string
for n := 0; n < b.N; n++ {
var str string
for i := 0; i < cnt; i++ {str += sss}
result = str
}
b.StopTimer()
if result != expected {b.Errorf("unexpected result; got=%s, want=%s", string(result), expected)
}
}
执行 go test -bench=. -benchmem
输出结果:
$ go test -bench=. -benchmem
goos: windows
goarch: amd64
BenchmarkCopyPreAllocate-8 10000 117600 ns/op 344065 B/op 2 allocs/op
BenchmarkAppendPreAllocate-8 20000 75300 ns/op 344065 B/op 2 allocs/op
BenchmarkBufferPreAllocate-8 20000 97149 ns/op 344065 B/op 2 allocs/op
BenchmarkStringRepeat-8 100000 18349 ns/op 172032 B/op 1 allocs/op
BenchmarkCopy-8 10000 152417 ns/op 862307 B/op 13 allocs/op
BenchmarkAppend-8 10000 157210 ns/op 1046405 B/op 23 allocs/op
BenchmarkBufferWriteBytes-8 10000 173207 ns/op 862374 B/op 14 allocs/op
BenchmarkStringBuilderWriteBytes-8 10000 155715 ns/op 874468 B/op 24 allocs/op
BenchmarkBufferWriteString-8 10000 165700 ns/op 862373 B/op 14 allocs/op
BenchmarkStringPlusOperator-8 20 84450010 ns/op 885204590 B/op 10037 allocs/op
PASS
ok _/D_/code/tech.mojotv.cn/tutorials 18.797s
下面着重解释下说出的结果, 看到函数后面的 - 8 了吗?这个表示运行时对应的 GOMAXPROCS
的值.
接着的 10000 表示运行 for 循环的次数, 也就是调用被测试代码的次数, 最后的 174799 ns/op
表示每次需要话费 174799 纳秒.14 allocs/op
表示每次执行分配了 32 字节内存.
8. 结论:
如果合并大量重复的字符串请使用strings.Repeat
, 如果要合并不同的字符串, 且图方便建议使用string.Builder + Write bytes/string.
- 1. 使用 strings.Repeat 效率最高, 从 strings.Repeat 源码它是提前分配内存, 使用 strings.Builder. 所以他的效率更高 18379 ns/op, 大约是其他的 1 /10.
- 2. 其次使用 strings.Buffer 提前分配内存 120803 ns/op
- 3. 使用
+
连接字符串效率最低 87599885 ns/op - 4.Buffer Write bytes 和 Buffer Write string 几乎没有差别, 因为在 Go 语言中 string 就是 []byte.
以上就是这篇文章的全部内容了, 希望本文的内容对大家的学习或者工作能带来一定的帮助, 如果有疑问大家可以留言交流,谢谢大家对 mojotv.cn 的支持. 喜欢这个网站麻烦帮忙添加到收藏夹, 添加我的微信好友: felixarebest 微博账号: MojoTech 向我提问.