Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了对立并且惟一的二进制编码,以满足跨语言、跨平台进行文本转换、解决的要求。
在理论利用有很多须要中文和 unicode 转换的场景,这里次要介绍通过 golang 实现中文和 unicode 相互转换。
1、中文转 unicode
这一步比较简单
示例
sText := "hello 你好"
textQuoted := strconv.QuoteToASCII(sText)
textUnquoted := textQuoted[1 : len(textQuoted)-1]
fmt.Println(textUnquoted)
2、unicode 转中文
网上有些例子,通过 u 分隔来实现,这种形式存在局限性。比方字符外面含有非中文字符,就会呈现问题。
正确转换示例
package main
import (
"fmt"
"strconv"
"strings"
)
func zhToUnicode(raw []byte) ([]byte, error) {str, err := strconv.Unquote(strings.Replace(strconv.Quote(string(raw)), `\\u`, `\u`, -1))
if err != nil {return nil, err}
return []byte(str), nil
}
func main() {
sText := "hello 你好"
textQuoted := strconv.QuoteToASCII(sText)
textUnquoted := textQuoted[1 : len(textQuoted)-1]
fmt.Println(textUnquoted)
v, _ := zhToUnicode([]byte(textUnquoted))
fmt.Println(string(v))
}
strconv.Quote(s string)string
-> 返回字符串在 go 语法下的双引号字面值示意,控制字符和不可打印字符会进行本义 (t,n 等)strconv.Unquote(s string)(t string,err error)
-> 函数假如 s 是一个半引号、双引号、反引号突围的 go 语法字符串,解析它并返回它示意的值。(如果是单引号括起来的,函数会认为 s 是 go 字符字面值,返回一个单字符的字符串)
links
- 目录
- 上一节:
- 下一节: