1.不同字符与获取字符串长度
获取字符串长度,是字符串操作的重要方法。理论来说,获取字符串长度,只要从头到尾查找一遍就可以了。但遗憾的是,不同字符具有不同的编码格式。拉丁字母一个字符只要一个字节就行,而中文则可能需要两道三个字节;UNICODE把所有字符设置为2个字节,UTF-8格式则把所有字符设置为1--3个字节。
因此,字符串长度的获得,不等于按字节数查找,而要根据不同字符编码查找。
2.golang中获取字符串长度的方法
对于中文开发者来说,经常需要对字符串进行长度判断。golang有自己的默认判断长度函数len();但遗憾的是,len()函数判断字符串长度的时候,是判断字符的字节数而不是字符长度。因此,在中文字符下,应该采用如下方法:
1)使用 bytes.Count() 统计
2)使用 strings.Count() 统计
3)将字符串转换为 []rune 后调用 len 函数进行统计
4)使用 utf8.RuneCountInString() 统计
3.样例展示
s := "欢迎学习Go的len()函数"
r := []rune(strTest)
fmt.Println(len(r))
fmt.Println(len(s))
fmt.Println(bytes.Count([]byte(s), nil) - 1)
fmt.Println(strings.Count(s, "") - 1)
fmt.Println(utf8.RuneCountInString(s))