1.不同字符与获取字符串长度

获取字符串长度,是字符串操作的重要方法。理论来说,获取字符串长度,只要从头到尾查找一遍就可以了。但遗憾的是,不同字符具有不同的编码格式。拉丁字母一个字符只要一个字节就行,而中文则可能需要两道三个字节;UNICODE把所有字符设置为2个字节,UTF-8格式则把所有字符设置为1--3个字节。

因此,字符串长度的获得,不等于按字节数查找,而要根据不同字符编码查找。

2.golang中获取字符串长度的方法

对于中文开发者来说,经常需要对字符串进行长度判断。golang有自己的默认判断长度函数len();但遗憾的是,len()函数判断字符串长度的时候,是判断字符的字节数而不是字符长度。因此,在中文字符下,应该采用如下方法:

1)使用 bytes.Count() 统计

2)使用 strings.Count() 统计

3)将字符串转换为 []rune 后调用 len 函数进行统计

4)使用 utf8.RuneCountInString() 统计

3.样例展示

补充:Go语言获取中英文混和字符串的长度以及子字符串的方法

1. 纯英文字符串

使用len()函数。

长度是6。

2. 中英文混合字符串

2.1 先使用len()函数。

这种方法的到的是字节数。Go语言中,中文字符按utf-8编码,占3字节,故长度是31。故此方法不适用统计中英文混合或者中文字符串长度。

2.2 使用utf8.RuneCountInString()方法。

此方法可统计字符数,输出结果是15。

2.3 转成[]rune类型,再对此类型进行操作

此方法也可输出字符个数15。但是此方法能获取指定下标范围的子字符串,也能获取指定下标位置的字符。比第二种方法方便。

3.示例代码

4. 示例结果

总结

如果是对中英文进行操作,建议用第三种方式。先转成rune[]型,再进行操作。

以上为个人经验,希望能给大家一个参考,也希望大家多多支持。如有错误或未考虑完全的地方,望不吝赐教。