golang中,带有表情的字符串,通过json.Marshal()后,并不会进行unicode,所以会导致存储进数据库中的表情为乱码。
例子:
func TestOther(t *testing.T) { str := "哈哈😝👌" strr, _ := json.Marshal(str) t.Log(str) t.Log(fmt.Sprintf("%s", strr)) }
输出:
下面,我们开发了一个将字符串unicode的方法:
type EmojiUnicodeString string func (em EmojiUnicodeString) MarshalJSON() ([]byte, error) { encodes := utf16.Encode([]rune(em)) ret := `"` for _, enc := range encodes { //ascii可见字符范围0-9a-zA-Z if (enc >= 0x30 && enc <= 0x39) || (enc >= 0x41 && enc <= 0x5A) || (enc >= 0x61 && enc <= 0x7A) { ret = ret + string(rune(enc)) } else { //其他都使用utf16编码 if encStr := strconv.FormatUint(uint64(enc), 16); encStr != "" { //补齐4位长度 diff := 4 - len(encStr) for i := 0; i < diff; i++ { encStr = "0" + encStr } ret = ret + `\u` + encStr } } } ret = ret + `"` return []byte(ret), nil }
测试:
func TestOther(t *testing.T) { str := "哈哈😝👌" strr, _ := json.Marshal(str) t.Log(str) t.Log(fmt.Sprintf("%s", strr)) str2 := EmojiUnicodeString(str) strr2, _ := json.Marshal(str2) t.Log(fmt.Sprintf("%s", strr2)) }
输出:
可以看到,该带有表情的字符串已经unicode话,此时就可以直接进行数据库存储了。