golang默认编码为utf-8,但网页中会有各种格式像常见的"gb2312","gbk"等。处理这些编码的网页时就会出现头大的乱码.golang没有自带的编解码包,需要借助第三方包处理。推荐:golang教程

第三方包

code.google.com/p/mahonia

使用简介

code貌似托管在谷歌的服务器上,国内用户可能要翻墙,我在github上fork了一个mahonia.

先判断是否支持你想要的编码格式,不支持的话,返回值为nil

func GetCharset(name string) *Charset

if mahonia.GetCharset(char) == nil {

    return nil, fmt.Errorf("%s charset not suported \n", char)}

创建特定编码格式的decoder

func NewDecoder(name string) Decoder

dec := mahonia.NewDecoder(char)

接着直接解码:常用的有直接从字符串解码及从io流解码

func (d Decoder) ConvertString(s string) string
func (d Decoder) NewReader(rd io.Reader) *Reader

这里用的是io流,因为下面还用到类似于jquery的一个工具包,便于连贯陈述

rd := dec.NewReader(resp.Body)