共计 5423 个字符,预计需要花费 14 分钟才能阅读完成。
Go 字符串详解
[TOC]
总结:
字符串是不可变值类型,内部⽤指针指向 UTF-8 字节数组。
默认值是空字符串 “”。
⽤索引号访问某字节,如 s[i]。取出的是字节,不是字符
不能⽤序号获取字节元素指针,&s[i] ⾮法。
不可变类型,⽆法修改字节数组。使用 []rune 进行修改是重新分配内存,并复制字节数组
字符串可以用 == 和 < 进行比较;
go 语言的字符串是 utf- 8 的定长字符序列,会自动转为 Unicode,然后可以通过 []rune 按索引取出字符。
1、字符串的定义
在 Go 语言中,字符串字面量使用双引号 “” 或者反引号 ‘ 来创建。
双引号用来创建可解析的字符串,支持转义,但不能用来引用多行;
反引号用来创建原生的字符串字面量,可能由多行组成,但不支持转义,并且可以包含除了反引号外其他所有字符。
双引号创建可解析的字符串应用最广泛,反引号用来创建原生的字符串则多用于书写多行消息,HTML 以及正则表达式。
s:=” 今天很开心 ”
s:=` 今天开心吗
不开心啊
真的?`
2、字符串操作
(1) 字符串支持 + 连接操作和 += 追加操作
连接跨⾏字符串时,“+” 必须在上⼀⾏末尾,否则导致编译错误。
s := “Hello, ” +
“World!”
s2 := “Hello, ”
+ “World!” // Error: invalid operation: + untyped string
s+=”abc”
其他函数连接这里暂不说明
(2) ⽀持⽤两个索引号返回⼦串。⼦串依然指向原字节数组,仅修改了指针和⻓度属性。
s := “Hello, World!”
s1 := s[:5] // Hello
s2 := s[7:] // World!
s3 := s[1:5] // ello
注意:如果字符串中有汉字,汉字占得就是 3 个字节,所以就不一定能取出
(3) 字符串底层分析
struct String{// 字符串是个不可变值类型,存储了字节和长度
byte* str;
intgo len;
};
字符串是 UTF-8 字符的一个序列(当字符为 ASCII 码时则占用 1 个字节,其它字符根据需要占用 2-4 个字节)
go 语言中字符串的字节使用 UTF- 8 编码表示 Unicode 文本。因此 Go 语言字符串是变宽字符序列,每一个字符都用一个或者多个字符表示,这跟其他的(C++,Java,Python 3)的字符串类型有着本质上的不同,后者为定宽字符序列。
每一个 Unicode 字符都有一个唯一的叫做“码点”的标识数字。在 Go 语言中,一个单一的码点在内存中以 rune 的形式表示,rune 表示 int32 类型的别名。可以将 Go 语言的字符串转化为 Unicode 码点切片(类型为 []rune),切片是支持直接索引的。
package main
import(
“fmt”
)
func main() {
s:=”abc 好好学习 ”
fmt.Println(s)
for _,b:=range []byte(s){
fmt.Printf(“%x “,b) // 打印 16 进制
}
fmt.Println(“\n 字节长度:”,len(s))
for i,ch:=range s{//ch 是 rune int32 别名 4 个字节
fmt.Printf(“(%d %x)”,i,ch)
}
fmt.Println()
for i,ch:=range []rune(s){
fmt.Printf(“(%d %c)”,i,ch)
}
}
// 输出结果
abc 好好学习
61 62 63 e5 a5 bd e5 a5 bd e5 ad a6 e4 b9 a0
字节长度:15
(0 61)(1 62)(2 63)(3 597d)(6 597d)(9 5b66)(12 4e60)
(0 a)(1 b)(2 c)(3 好)(4 好)(5 学)(6 习)
上面代码显示, 我们把字符串转为 []bype 数组,打印出 utf- 8 的字节,可以看到“学”这个汉字占了 e5 ad a6 三个 16 进制字节。看到一个汉字占 3 个字节,一个英文字母占 1 个字节,utf- 8 是可变宽度。
遍历 s, 取出的是 Unicode 码,可以看到“学”这个汉字的 Unicode 是 5b66,它是从第 9 个开始的,(9 5b66)。
将字符串转为 []rune 也就是 int32 的别名,占 4 个字节。打印出了 abc 好好学习。
说明:go 语言的字符串是 utf- 8 的定长字符序列,会自动转为 Unicode,然后可以通过 []rune 按索引取出字符。
3、String 包的使用
查找操作
func Contains(s, substr string) bool
func Index(s, sep string) int
func Count(s, sep string) int
重复操作
func Replace(s, old, new string, n int) string
删除操作
func Trim(s string, cutset string) string
大小写转换
func Title(s string) string
func ToLower(s string) string
func ToUpper(s string) string
字符串前缀后缀
func HasPrefix(s, prefix string) bool
func HasSuffix(s, suffix string) bool
字符串分割
func Split(s, sep string) []string
func Fields(s string) []string
查找操作
判断给定字符串 s 中是否包含子串 substr, 找到返回 true, 找不到返回 false
func Contains(s, substr string) bool
实例如下:
package main
import (
“fmt”
“strings”
)
func main() {
fmt.Println(“ 包含子串返回:”, strings.Contains(“oldboy”, “boy”))
fmt.Println(“ 不包含子串返回:”, strings.Contains(“oldboy”, “girl”))
fmt.Println(“ 子字符串是空字符串返回:”, strings.Contains(“hello”, “”))
fmt.Println(“ 原字符串、子字符串都是空字符串返回:”, strings.Contains(“”, “”))
fmt.Println(“ 中文字符串包含子串返回:”, strings.Contains(“ 我很帅 ”, “ 帅 ”))
}
运行结果:
包含子串返回:true
不包含子串返回:false
子字符串是空字符串返回:true
原字符串、子字符串都是空字符串返回:true
中文字符串包含子串返回:true
在字符串 s 中查找 sep 所在的位置, 返回位置值, 找不到返回 -1
func Index(s, sep string) int
实例如下:
package main
import (
“fmt”
“strings”
)
func main() {
fmt.Println(“ 存在返回第一个匹配字符的位置:”, strings.Index(“heloboy”, “boy”))
fmt.Println(“ 不存在返回:”, strings.Index(“helo”, “day”))
fmt.Println(“ 中文字符串存在返回:”, strings.Index(“ 我很帅 ”, “ 很帅 ”))
}
运行结果:
存在返回第一个匹配字符的位置:4
不存在返回:-1
中文字符串存在返回:3 // 这里是按照字节的顺序返回 一个汉字是 3 个字节,所以这个是从索引为 3 的开始
统计给定子串 sep 的出现次数, sep 为空时, 返回字符串的长度 + 1
func Count(s, sep string) int
实例如下:
package main
import (
“fmt”
“strings”
)
func main() {
fmt.Println(“ 子字符串出现次数:”, strings.Count(“hello world”, “o”))
fmt.Println(“ 子字符串为空时, 返回:”, strings.Count(“hello”, “”))
}
运行结果:
子字符串出现次数:2
子字符串为空时, 返回:6
重复操作
重复 s 字符串 count 次, 最后返回新生成的重复的字符串
func Repeat(s string, count int) string
实例如下:
package main
import (
“fmt”
“strings”
)
func main() {
fmt.Println(strings.Repeat(“ 嘀嗒 ”, 4), “ 时针它不停在转动 ”)
}
运行结果:
嘀嗒嘀嗒嘀嗒嘀嗒 时针它不停在转动
替换操作
在 s 字符串中, 把 old 字符串替换为 new 字符串,n 表示替换的次数,如果 n <0 会替换所有 old 子串。
func Replace(s, old, new string, n int) string
实例如下:
package main
import (
“fmt”
“strings”
)
func main() {
fmt.Println(strings.Replace(“hel hel hel”, “l”, “llo”, 2))
fmt.Println(strings.Replace(“hel hel hel”, “l”, “llo”, -1))
}
运行结果:
hello hello hel
hello hello hello
删除操作
删除在 s 字符串的头部和尾部中由 cutset 指定的字符, 并返回删除后的字符串
func Trim(s string, cutset string) string
实例如下:
package main
import (
“fmt”
“strings”
)
func main() {
fmt.Println(strings.Trim(” hello “, ” “))
}
运行结果:
hello
大小写转换
给定字符串转换为英文标题的首字母大写的格式 (不能正确处理 unicode 标点)
func Title(s string) string
返回将所有字母都转为对应的小写版本的拷贝
func ToLower(s string) string
返回将所有字母都转为对应的大写版本的拷贝
func ToUpper(s string) string
实例如下:
package main
import (
“fmt”
“strings”
)
func main() {
fmt.Println(strings.Title(“It is never too late to learn.”))
fmt.Println(strings.ToLower(“It Is Never Too Late To Learn.”))
fmt.Println(strings.ToUpper(“It is never too late to learn.”))
}
运行结果:
It Is Never Too Late To Learn.
it is never too late to learn.
IT IS NEVER TOO LATE TO LEARN.
字符串前缀后缀
判断字符串是否包含前缀 prefix,大小写敏感
func HasPrefix(s, prefix string) bool
判断 s 是否有后缀字符串 suffix,大小写敏感
func HasSuffix(s, suffix string) bool
实例如下:
package main
import (
“fmt”
“strings”
)
func main() {
fmt.Println(“ 前缀是以 hello 开头的:”, strings.HasPrefix(“helloworld”, “hello”))
fmt.Println(“ 后缀是以 world 开头的:”, strings.HasSuffix(“helloworld”, “world”))
}
运行结果:
前缀是以 hello 开头的:true
后缀是以 world 开头的:true
字符串分割
用去掉 s 中出现的 sep 的方式进行分割,会分割到结尾,并返回生成的所有片段组成的切片(每一个 sep 都会进行一次切割,即使两个 sep 相邻,也会进行两次切割)。如果 sep 为空字符,Split 会将 s 切分成每一个 unicode 码值一个字符串。
func Split(s, sep string) []string
返回将字符串按照空白(unicode.IsSpace 确定,可以是一到多个连续的空白字符)分割的多个字符串。如果字符串全部是空白或者是空字符串的话,会返回空切片。
func Fields(s string) []string
实例如下:
// 如果要分割的字符串位于字符串两端,会多出一个空字符串
package main
import (
“fmt”
“strings”
)
func main() {
fmt.Println(“Split 函数的用法 ”)
fmt.Printf(“%q\n”, strings.Split(“Linux,Python,Golang,Java”, “,”))
fmt.Printf(“%q\n”, strings.Split(“a mountain a temple”, “a “))
fmt.Printf(“%q\n”, strings.Split(” abc “, “”))
fmt.Printf(“%q\n”, strings.Split(“”, “oldboy”))
fmt.Println(“Fields 函数的用法 ”)
fmt.Printf(“Fields are: %q\n”, strings.Fields(” Linux Python Golang Java “))
}
运行结果:
Split 函数的用法
[“Linux” “Python” “Golang” “Java”]
[“” “mountain ” “temple”]
[” ” “a” “b” “c” ” “]
[“”]
Fields 函数的用法
Fields are: [“Linux” “Python” “Golang” “Java”]