在分布式的系统中,因为涉及到数据的传输,所以一定会进行数据的交换,此时就要定义数据交换的格式,例如二进制、Json、Xml等等。本篇文章就是总结一下常用的几种数据格式。

一、Json格式

如果想使用Json数据格式,可以借助于encoding/json这个包。

利用json包里的 json.Marshal(xxx) 和 json.Unmarshal(data, &xxx) 进行序列化和反序列化。

下面举个例子:

执行:

执行结果:

  • 1.可以看到在C:/tmp/下面生成了一个Students.txt文件,打开里面存放是刚刚随机生成的10个学生数据
  • 2.执行结果可以看到控制台打印:

二、Xml格式

Xml格式也是我们常用的数据格式,同样要使用Xml格式,可以使用encoding/xml这个包。

像上面json一样,同样存在 xml.Marshal(xxx) 和 xml.Unmarshal(data, &xxx) 两个方法。此外还有方法xml.MarshalIndent(xxx) 可以格式化xml

先熟悉一下XML对应 标签怎么写:

  • - XMLName字段,如上所述,会省略
  • - 具有标签"-"的字段会省略
  • - 具有标签"name,attr"的字段会成为该XML元素的名为name的属性
  • - 具有标签",attr"的字段会成为该XML元素的名为字段名的属性
  • - 具有标签",chardata"的字段会作为字符数据写入,而非XML元素
  • - 具有标签",innerxml"的字段会原样写入,而不会经过正常的序列化过程
  • - 具有标签",comment"的字段作为XML注释写入,而不经过正常的序列化过程,该字段内不能有"--"字符串
  • - 标签中包含"omitempty"选项的字段如果为空值会省略
    空值为false、0、nil指针、nil接口、长度为0的数组、切片、映射
  • - 匿名字段(其标签无效)会被处理为其字段是外层结构体的字段
  • - 如果一个字段的标签为"a>b>c",则元素c将会嵌套进其上层元素a和b中。如果该字段相邻的字段标签指定了同样的上层元素,则会放在同一个XML元素里。
  • - 如果一个字段的标签为"a>b>c",则元素c将会嵌套进其上层元素a和b中。如果该字段相邻的字段标签指定了同样的上层元素,则会放在同一个XML元素里。

下面举个例子:

例如我想创建一个如下的xml数据:

我就可以创建下面这样的结构体:

写文件方法:

如上代码,使用了MarshalIndent方法,第一个参数是需要序列化的数据,第二参数是前缀,第三个是缩进的字符串(这里是四个空格),然后在main方法中调用一下即可(代码略)。

这里主要想说明一下结构体里面的标签:

XmlName可以省略不写,不写的话最外层就是用的结构体的名称,例如第一个结构体是Servers,那么xml最外层的节点名称就是Servers。

读的话,使用 xml.Unmarshal(data, &xxx) 就可以实现了。

三、msgPack格式

上面两种Json和Xml格式,都是文本格式的数据,好处在于能够方便的阅读。但是问题在于占用空间比较大。所以又出现了MsgPack这种格式,它是在json基础上转换为二进制进行传输的。对应关系像下面这个图:

MsgPack并没有官方的包,我们需要使用一个第三方的包,项目地址:https://github.com/vmihailenco/msgpack

实现比较简单,将 json.Marshal 和 json.Unmarshal 中的【 json】替换为【 maspack】即可,下面是对上面代码的改造,创建了10000个学生的数据。

四、protobuf格式

protobuf是Google公司开发出的一种数据格式。官方文档地址:https://developers.google.cn/protocol-buffers/ 。

简单讲它使用了IDL语言作为中间语言来串联不同的编程语言。不同的语言可以根据生成的IDL中间语言,生成自己的语言。

这样做有什么好处? 举个例子:当我们在协作开发的时候,A部门使用的是Go语言、B部分使用的是Java语言,C部门使用的是C#语言,当他们之间进行数据交换的时候,都要各自维护自己的结构体,才能进行数据的

序列化和反序列化,使用protobuf的好处就是只需要一个IDL描述,然后生成不同的语言的结构,这样维护一份就可以了。

同时 prototbuf的性能也很好,这也是它的一个优势。IDL语言使用的变长编码(根据整数的范围 0-255 那么这个数字就占用1个字节 ,如果使用定长编码的话 一个整数可能就是 4个字节)所以它的空间利用率是很好的。

那开发流程是怎样的?

  • A. IDL编写
  • B. 生成只定语言的代码
  • C. 序列化和反序列化

如何在Go中应用prototbuf

A.安装protoc编译器

解压后拷贝到GOPATH/bin目录下, 下载地址:https://github.com/google/protobuf/releases

然后把bin下面的protoc.exe 这个放到GoPath下的bin中,打开cmd,输入protoc,应该会出现如下内容:

如果不存在,可以将Gopath的bin加入到系统的环境变量path当中。

B.安装生成Go语言的插件

执行命令:

C. 创建一个简单的proto文件

message 就可以理解成类, repeated可以理解成数组。

D.利用之前下载好的protoc.exe 生成一个Go的代码。

第一个【.】代表当前输出的目录,后面*.proto则是 proto文件的路径

protoc--go_out=.  *.proto

protoc --go_out=.\school\ .\school.proto

执行之后会生成如下的文件,这个go文件就可以直接使用了。

E. 使用生成的Go文件

①使用 proto.Marshal() 执行序列化

②使用proto.Unmarshal(data, &mySchool)执行反序列化

Q&A

如果在使用protobuf生成的Go文件,出现了如下的异常:

undefined: proto.ProtoPackageIsVersion3

这个时候可能是由于上面两步下载的protoc.exe 和 protobuf 的版本不一致导致的。

  • 1. 可以清空下gopath下的 github.com\golang\protobuf 然后重新下载,并在github.com\golang\protobuf\protoc-gen-go 执行 go install 命令。
  • 2. 检查一下是不是使用了 godep 等包管理工具,里面引用的版本和protoc.exe 不一致造成的