golang默认编码为utf-8,但网页中会有各种格式像常见的"gb2312","gbk"等。处理这些编码的网页时就会出现头大的乱码.golang没有自带的编解码包,需要借助第三方包处理。推荐:golang教程
第三方包
code.google.com/p/mahonia
使用简介
code貌似托管在谷歌的服务器上,国内用户可能要翻墙,我在github上fork了一个mahonia.
先判断是否支持你想要的编码格式,不支持的话,返回值为nil
func GetCharset(name string) *Charset
if mahonia.GetCharset(char) == nil { return nil, fmt.Errorf("%s charset not suported \n", char)}
创建特定编码格式的decoder
func NewDecoder(name string) Decoder
dec := mahonia.NewDecoder(char)
接着直接解码:常用的有直接从字符串解码及从io流解码
func (d Decoder) ConvertString(s string) string
func (d Decoder) NewReader(rd io.Reader) *Reader
这里用的是io流,因为下面还用到类似于jquery的一个工具包,便于连贯陈述
rd := dec.NewReader(resp.Body)