uber-go/guide 的中文翻译

Uber Go 语言编码规范

Uber 是一家美国硅谷的科技公司,也是 Go 语言的早期 adopter。其开源了很多 golang 项目,诸如被 Gopher 圈熟知的 zap、jaeger 等。2018 年年末 Uber 将内部的 Go 风格规范 开源到 GitHub,经过一年的积累和更新,该规范已经初具规模,并受到广大 Gopher 的关注。本文是该规范的中文版本。本版本会根据原版实时更新。

## 版本

  • 当前更新版本:2022-05-25 版本地址:commit:#150
  • 如果您发现任何更新、问题或改进,请随时 fork 和 PR
  • Please feel free to fork and PR if you find any updates, issues or improvement.

目录




介绍

样式 (style) 是支配我们代码的惯例。术语

样式

有点用词不当,因为这些约定涵盖的范围不限于由 gofmt 替我们处理的源文件格式。


本指南的目的是通过详细描述在 Uber 编写 Go 代码的注意事项来管理这种复杂性。这些规则的存在是为了使代码库易于管理,同时仍然允许工程师更有效地使用 Go 语言功能。

该指南最初由 Prashant Varanasi 和 Simon Newton 编写,目的是使一些同事能快速使用 Go。多年来,该指南已根据其他人的反馈进行了修改。

本文档记录了我们在 Uber 遵循的 Go 代码中的惯用约定。其中许多是 Go 的通用准则,而其他扩展准则依赖于下面外部的指南:

所有代码都应该通过

golint

go vet

的检查并无错误。我们建议您将编辑器设置为:


  • 保存时运行 goimports
  • 运行 golint
    和 go vet
    检查错误

您可以在以下 Go 编辑器工具支持页面中找到更为详细的信息: https://github.com/golang/go/wiki/IDEsAndTextEditorPlugins

指导原则

指向 interface 的指针

您几乎不需要指向接口类型的指针。您应该将接口作为值进行传递,在这样的传递过程中,实质上传递的底层数据仍然可以是指针。

接口实质上在底层用两个字段表示:

  1. 一个指向某些特定类型信息的指针。您可以将其视为"type"。
  2. 数据指针。如果存储的数据是指针,则直接存储。如果存储的数据是一个值,则存储指向该值的指针。

如果希望接口方法修改基础数据,则必须使用指针传递 (将对象指针赋值给接口变量)。

type F interface {
  f()
}

type S1 struct{}

func (s S1) f() {}

type S2 struct{}

func (s *S2) f() {}

// f1.f() 无法修改底层数据
// f2.f() 可以修改底层数据,给接口变量 f2 赋值时使用的是对象指针
var f1 F = S1{}
var f2 F = &S2{}

Interface 合理性验证

在编译时验证接口的符合性。这包括:

  • 将实现特定接口的导出类型作为接口 API 的一部分进行检查
  • 实现同一接口的 (导出和非导出) 类型属于实现类型的集合
  • 任何违反接口合理性检查的场景,都会终止编译,并通知给用户

补充:上面 3 条是编译器对接口的检查机制, 大体意思是错误使用接口会在编译期报错。 所以可以利用这个机制让部分问题在编译期暴露。

BadGood
wzxhzdk:3wzxhzdk:4

如果

*Handler

http.Handler

的接口不匹配, 那么语句

var _ http.Handler = (*Handler)(nil)

将无法编译通过。


赋值的右边应该是断言类型的零值。 对于指针类型(如

*Handler

)、切片和映射,这是

nil

; 对于结构类型,这是空结构。


type LogHandler struct {
  h   http.Handler
  log *zap.Logger
}
var _ http.Handler = LogHandler{}
func (h LogHandler) ServeHTTP(
  w http.ResponseWriter,
  r *http.Request,
) {
  // ...
}

接收器 (receiver) 与接口

使用值接收器的方法既可以通过值调用,也可以通过指针调用。

带指针接收器的方法只能通过指针或 addressable values 调用。

例如,

type S struct {
  data string
}

func (s S) Read() string {
  return s.data
}

func (s *S) Write(str string) {
  s.data = str
}

sVals := map[int]S{1: {"A"}}

// 你只能通过值调用 Read
sVals[1].Read()

// 这不能编译通过:
//  sVals[1].Write("test")

sPtrs := map[int]*S{1: {"A"}}

// 通过指针既可以调用 Read,也可以调用 Write 方法
sPtrs[1].Read()
sPtrs[1].Write("test")

类似的,即使方法有了值接收器,也同样可以用指针接收器来满足接口。

type F interface {
  f()
}

type S1 struct{}

func (s S1) f() {}

type S2 struct{}

func (s *S2) f() {}

s1Val := S1{}
s1Ptr := &S1{}
s2Val := S2{}
s2Ptr := &S2{}

var i F
i = s1Val
i = s1Ptr
i = s2Ptr

//  下面代码无法通过编译。因为 s2Val 是一个值,而 S2 的 f 方法中没有使用值接收器
//   i = s2Val

Effective Go 中有一段关于 pointers vs. values 的精彩讲解。

补充:

  • 一个类型可以有值接收器方法集和指针接收器方法集
  • 值接收器方法集是指针接收器方法集的子集,反之不是
  • 规则
  • 值对象只可以使用值接收器方法集
  • 指针对象可以使用 值接收器方法集 + 指针接收器方法集
  • 接口的匹配 (或者叫实现)
  • 类型实现了接口的所有方法,叫匹配
  • 具体的讲,要么是类型的值方法集匹配接口,要么是指针方法集匹配接口

具体的匹配分两种:

  • 值方法集和接口匹配
  • 给接口变量赋值的不管是值还是指针对象,都 ok,因为都包含值方法集
  • 指针方法集和接口匹配
  • 只能将指针对象赋值给接口变量,因为只有指针方法集和接口匹配
  • 如果将值对象赋值给接口变量,会在编译期报错 (会触发接口合理性检查机制)

为啥 i = s2Val 会报错,因为值方法集和接口不匹配。

零值 Mutex 是有效的

零值

sync.Mutex

sync.RWMutex

是有效的。所以指向 mutex 的指针基本是不必要的。


BadGood
wzxhzdk:8wzxhzdk:9

如果你使用结构体指针,mutex 应该作为结构体的非指针字段。即使该结构体不被导出,也不要直接把 mutex 嵌入到结构体中。

BadGood
wzxhzdk:10wzxhzdk:11
`Mutex` 字段, `Lock` 和 `Unlock` 方法是 `SMap` 导出的 API 中不刻意说明的一部分。mutex 及其方法是 `SMap` 的实现细节,对其调用者不可见。

在边界处拷贝 Slices 和 Maps

slices 和 maps 包含了指向底层数据的指针,因此在需要复制它们时要特别注意。

接收 Slices 和 Maps

请记住,当 map 或 slice 作为函数参数传入时,如果您存储了对它们的引用,则用户可以对其进行修改。

BadGood
wzxhzdk:12wzxhzdk:13

返回 slices 或 maps

同样,请注意用户对暴露内部状态的 map 或 slice 的修改。

BadGood
wzxhzdk:14wzxhzdk:15

使用 defer 释放资源

使用 defer 释放资源,诸如文件和锁。

BadGood
wzxhzdk:16wzxhzdk:17

Defer 的开销非常小,只有在您可以证明函数执行时间处于纳秒级的程度时,才应避免这样做。使用 defer 提升可读性是值得的,因为使用它们的成本微不足道。尤其适用于那些不仅仅是简单内存访问的较大的方法,在这些方法中其他计算的资源消耗远超过

defer


Channel 的 size 要么是 1,要么是无缓冲的

channel 通常 size 应为 1 或是无缓冲的。默认情况下,channel 是无缓冲的,其 size 为零。任何其他尺寸都必须经过严格的审查。我们需要考虑如何确定大小,考虑是什么阻止了 channel 在高负载下和阻塞写时的写入,以及当这种情况发生时系统逻辑有哪些变化。(翻译解释:按照原文意思是需要界定通道边界,竞态条件,以及逻辑上下文梳理)

BadGood
wzxhzdk:18wzxhzdk:19

枚举从 1 开始

在 Go 中引入枚举的标准方法是声明一个自定义类型和一个使用了 iota 的 const 组。由于变量的默认值为 0,因此通常应以非零值开头枚举。

BadGood
wzxhzdk:20wzxhzdk:21

在某些情况下,使用零值是有意义的(枚举从零开始),例如,当零值是理想的默认行为时。

type LogOutput int

const (
  LogToStdout LogOutput = iota
  LogToFile
  LogToRemote
)

// LogToStdout=0, LogToFile=1, LogToRemote=2

使用 time 处理时间

时间处理很复杂。关于时间的错误假设通常包括以下几点。

  1. 一天有 24 小时
  2. 一小时有 60 分钟
  3. 一周有七天
  4. 一年 365 天

例如,1 表示在一个时间点上加上 24 小时并不总是产生一个新的日历日。

因此,在处理时间时始终使用 [

"time"

] 包,因为它有助于以更安全、更准确的方式处理这些不正确的假设。


使用 time.Time
表达瞬时时间

在处理时间的瞬间时使用 [

time.Time

],在比较、添加或减去时间时使用

time.Time

中的方法。


BadGood
wzxhzdk:23wzxhzdk:24

使用 time.Duration
表达时间段

在处理时间段时使用 [

time.Duration

] .


BadGood
wzxhzdk:25wzxhzdk:26

回到第一个例子,在一个时间瞬间加上 24 小时,我们用于添加时间的方法取决于意图。如果我们想要下一个日历日 (当前天的下一天) 的同一个时间点,我们应该使用 [

Time.AddDate

]。但是,如果我们想保证某一时刻比前一时刻晚 24 小时,我们应该使用 [

Time.Add

]。


newDay := t.AddDate(0 /* years */, 0 /* months */, 1 /* days */)
maybeNewDay := t.Add(24 * time.Hour)

对外部系统使用 time.Time
和 time.Duration

尽可能在与外部系统的交互中使用

time.Duration

time.Time

例如 :


  • Command-line 标志: [flag
    ] 通过 [time.ParseDuration
    ] 支持 time.Duration
  • JSON: [encoding/json
    ] 通过其 [UnmarshalJSON
    method] 方法支持将 time.Time
    编码为 RFC 3339 字符串
  • SQL: [database/sql
    ] 支持将 DATETIME
    或 TIMESTAMP
    列转换为 time.Time
    ,如果底层驱动程序支持则返回
  • YAML: [http://gopkg.in/yaml.v2
    ] 支持将 time.Time
    作为 RFC 3339 字符串,并通过 [time.ParseDuration
    ] 支持 time.Duration

当不能在这些交互中使用

time.Duration

时,请使用

int

float64

,并在字段名称中包含单位。


例如,由于

encoding/json

不支持

time.Duration

,因此该单位包含在字段的名称中。


BadGood
wzxhzdk:28wzxhzdk:29

当在这些交互中不能使用

time.Time

时,除非达成一致,否则使用

string

和 RFC 3339 中定义的格式时间戳。默认情况下,[

Time.UnmarshalText

] 使用此格式,并可通过 [

time.RFC3339

] 在

Time.Format

time.Parse

中使用。


尽管这在实践中并不成问题,但请记住,

"time"

包不支持解析闰秒时间戳(8728),也不在计算中考虑闰秒(15190)。如果您比较两个时间瞬间,则差异将不包括这两个瞬间之间可能发生的闰秒。


Errors

错误类型

声明错误的选项很少。 在选择最适合您的用例的选项之前,请考虑以下事项。

  • 调用者是否需要匹配错误以便他们可以处理它? 如果是,我们必须通过声明顶级错误变量或自定义类型来支持 [errors.Is
    ] 或 [errors.As
    ] 函数。
  • 错误消息是否为静态字符串,还是需要上下文信息的动态字符串? 如果是静态字符串,我们可以使用 [errors.New
    ],但对于后者,我们必须使用 [fmt.Errorf
    ] 或自定义错误类型。
  • 我们是否正在传递由下游函数返回的新错误? 如果是这样,请参阅错误包装部分。
错误匹配?错误消息指导
Nostatic[errors.New]
Nodynamic[fmt.Errorf]
Yesstatictop-level var with [errors.New]
Yesdynamiccustom error type

例如, 使用 [

errors.New

] 表示带有静态字符串的错误。 如果调用者需要匹配并处理此错误,则将此错误导出为变量以支持将其与

errors.Is

匹配。


无错误匹配错误匹配
wzxhzdk:30wzxhzdk:31

对于动态字符串的错误, 如果调用者不需要匹配它,则使用 [

fmt.Errorf

], 如果调用者确实需要匹配它,则自定义

error


无错误匹配错误匹配
wzxhzdk:32wzxhzdk:33

请注意,如果您从包中导出错误变量或类型, 它们将成为包的公共 API 的一部分。

错误包装

如果调用其他方法时出现错误, 通常有三种处理方式可以选择:

  • 将原始错误原样返回
  • 使用 fmt.Errorf
    搭配 %w
    将错误添加进上下文后返回
  • 使用 fmt.Errorf
    搭配 %v
    将错误添加进上下文后返回

如果没有要添加的其他上下文,则按原样返回原始错误。 这将保留原始错误类型和消息。 这非常适合底层错误消息有足够的信息来追踪它来自哪里的错误。

否则,尽可能在错误消息中添加上下文 这样就不会出现诸如“连接被拒绝”之类的模糊错误, 您会收到更多有用的错误,例如“呼叫服务 foo:连接被拒绝”。

使用

fmt.Errorf

为你的错误添加上下文, 根据调用者是否应该能够匹配和提取根本原因,在

%w

%v

动词之间进行选择。


  • 如果调用者应该可以访问底层错误,请使用 %w
    。 对于大多数包装错误,这是一个很好的默认值, 但请注意,调用者可能会开始依赖此行为。因此,对于包装错误是已知var
    或类型的情况,请将其作为函数契约的一部分进行记录和测试。
  • 使用 %v
    来混淆底层错误。 调用者将无法匹配它,但如果需要,您可以在将来切换到 %w

在为返回的错误添加上下文时,通过避免使用"failed to"之类的短语来保持上下文简洁,当错误通过堆栈向上渗透时,它会一层一层被堆积起来:

BadGood
wzxhzdk:34wzxhzdk:35
wzxhzdk:36wzxhzdk:37

然而,一旦错误被发送到另一个系统,应该清楚消息是一个错误(例如

err

标签或日志中的"Failed"前缀)。


错误命名

对于存储为全局变量的错误值, 根据是否导出,使用前缀

Err

err


var (
  // 导出以下两个错误,以便此包的用户可以将它们与 errors.Is 进行匹配。

  ErrBrokenLink = errors.New("link is broken")
  ErrCouldNotOpen = errors.New("could not open")

  // 这个错误没有被导出,因为我们不想让它成为我们公共 API 的一部分。 我们可能仍然在带有错误的包内使用它。

  errNotFound = errors.New("not found")
)

对于自定义错误类型,请改用后缀

Error


// 同样,这个错误被导出,以便这个包的用户可以将它与 errors.As 匹配。

type NotFoundError struct {
  File string
}

func (e *NotFoundError) Error() string {
  return fmt.Sprintf("file %q not found", e.File)
}

// 并且这个错误没有被导出,因为我们不想让它成为公共 API 的一部分。 我们仍然可以在带有 errors.As 的包中使用它。
type resolveError struct {
  Path string
}

func (e *resolveError) Error() string {
  return fmt.Sprintf("resolve %q", e.Path)
}

处理断言失败

类型断言 将会在检测到不正确的类型时,以单一返回值形式返回 panic。 因此,请始终使用“逗号 ok”习语。

BadGood
wzxhzdk:40wzxhzdk:41

不要使用 panic

在生产环境中运行的代码必须避免出现 panic。panic 是 级联失败 的主要根源 。如果发生错误,该函数必须返回错误,并允许调用方决定如何处理它。

BadGood
wzxhzdk:42wzxhzdk:43

panic/recover 不是错误处理策略。仅当发生不可恢复的事情(例如:nil 引用)时,程序才必须 panic。程序初始化是一个例外:程序启动时应使程序中止的不良情况可能会引起 panic。

var _statusTemplate = template.Must(template.New("name").Parse("_statusHTML"))

即使在测试代码中,也优先使用

t.Fatal

或者

t.FailNow

而不是 panic 来确保失败被标记。


BadGood
wzxhzdk:45wzxhzdk:46

使用 sync/atomic 包的原子操作对原始类型 (

int32

,

int64

等)进行操作,因为很容易忘记使用原子操作来读取或修改变量。


go.uber.org/atomic 通过隐藏基础类型为这些操作增加了类型安全性。此外,它包括一个方便的

atomic.Bool

类型。


BadGood
wzxhzdk:47wzxhzdk:48

避免可变全局变量

使用选择依赖注入方式避免改变全局变量。 既适用于函数指针又适用于其他值类型

BadGood
wzxhzdk:49wzxhzdk:50
wzxhzdk:51wzxhzdk:52

避免在公共结构中嵌入类型

这些嵌入的类型泄漏实现细节、禁止类型演化和模糊的文档。

假设您使用共享的

AbstractList

实现了多种列表类型,请避免在具体的列表实现中嵌入

AbstractList

。 相反,只需手动将方法写入具体的列表,该列表将委托给抽象列表。


type AbstractList struct {}
// 添加将实体添加到列表中。
func (l *AbstractList) Add(e Entity) {
  // ...
}
// 移除从列表中移除实体。
func (l *AbstractList) Remove(e Entity) {
  // ...
}
BadGood
wzxhzdk:54wzxhzdk:55

Go 允许 类型嵌入 作为继承和组合之间的折衷。外部类型获取嵌入类型的方法的隐式副本。默认情况下,这些方法委托给嵌入实例的同一方法。

结构还获得与类型同名的字段。 所以,如果嵌入的类型是 public,那么字段是 public。为了保持向后兼容性,外部类型的每个未来版本都必须保留嵌入类型。

很少需要嵌入类型。 这是一种方便,可以帮助您避免编写冗长的委托方法。

即使嵌入兼容的抽象列表 interface,而不是结构体,这将为开发人员提供更大的灵活性来改变未来,但仍然泄露了具体列表使用抽象实现的细节。

BadGood
wzxhzdk:56wzxhzdk:57

无论是使用嵌入结构还是嵌入接口,都会限制类型的演化。

  • 向嵌入接口添加方法是一个破坏性的改变。
  • 从嵌入结构体删除方法是一个破坏性改变。
  • 删除嵌入类型是一个破坏性的改变。
  • 即使使用满足相同接口的类型替换嵌入类型,也是一个破坏性的改变。

尽管编写这些委托方法是乏味的,但是额外的工作隐藏了实现细节,留下了更多的更改机会,还消除了在文档中发现完整列表接口的间接性操作。

避免使用内置名称

Go 语言规范 概述了几个内置的, 不应在 Go 项目中使用的 预先声明的标识符。

根据上下文的不同,将这些标识符作为名称重复使用, 将在当前作用域(或任何嵌套作用域)中隐藏原始标识符,或者混淆代码。 在最好的情况下,编译器会报错;在最坏的情况下,这样的代码可能会引入潜在的、难以恢复的错误。

BadGood
wzxhzdk:58wzxhzdk:59
wzxhzdk:60wzxhzdk:61

注意,编译器在使用预先分隔的标识符时不会生成错误, 但是诸如

go vet

之类的工具会正确地指出这些和其他情况下的隐式问题。


避免使用 init()

尽可能避免使用

init()

。当

init()

是不可避免或可取的,代码应先尝试:


  1. 无论程序环境或调用如何,都要完全确定。
  2. 避免依赖于其他init()
    函数的顺序或副作用。虽然init()
    顺序是明确的,但代码可以更改, 因此init()
    函数之间的关系可能会使代码变得脆弱和容易出错。
  3. 避免访问或操作全局或环境状态,如机器信息、环境变量、工作目录、程序参数/输入等。
  4. 避免I/O
    ,包括文件系统、网络和系统调用。

不能满足这些要求的代码可能属于要作为

main()

调用的一部分(或程序生命周期中的其他地方), 或者作为

main()

本身的一部分写入。特别是,打算由其他程序使用的库应该特别注意完全确定性, 而不是执行“init magic”


BadGood
wzxhzdk:62wzxhzdk:63
wzxhzdk:64wzxhzdk:65

考虑到上述情况,在某些情况下,

init()

可能更可取或是必要的,可能包括:


  • 不能表示为单个赋值的复杂表达式。
  • 可插入的钩子,如database/sql
    、编码类型注册表等。
  • 对 Google Cloud Functions 和其他形式的确定性预计算的优化。

追加时优先指定切片容量

追加时优先指定切片容量

在尽可能的情况下,在初始化要追加的切片时为

make()

提供一个容量值。


BadGood
wzxhzdk:66wzxhzdk:67
wzxhzdk:68wzxhzdk:69

主函数退出方式 (Exit)

Go 程序使用 [

os.Exit

] 或者 [

log.Fatal*

] 立即退出 (使用

panic

不是退出程序的好方法,请 不要使用 panic。)


仅在

main()

中调用其中一个

os.Exit

或者

log.Fatal*

。所有其他函数应将错误返回到信号失败中。


BadGood
wzxhzdk:70wzxhzdk:71

原则上:退出的具有多种功能的程序存在一些问题:

  • 不明显的控制流:任何函数都可以退出程序,因此很难对控制流进行推理。
  • 难以测试:退出程序的函数也将退出调用它的测试。这使得函数很难测试,并引入了跳过 go test
    尚未运行的其他测试的风险。
  • 跳过清理:当函数退出程序时,会跳过已经进入defer
    队列里的函数调用。这增加了跳过重要清理任务的风险。

一次性退出

如果可能的话,你的

main()

函数中 最多一次 调用

os.Exit

或者

log.Fatal

。如果有多个错误场景停止程序执行,请将该逻辑放在单独的函数下并从中返回错误。 这会缩短

main()

函数,并将所有关键业务逻辑放入一个单独的、可测试的函数中。


BadGood
wzxhzdk:72wzxhzdk:73

在序列化结构中使用字段标记

任何序列化到JSON、YAML、, 或其他支持基于标记的字段命名的格式应使用相关标记进行注释。

BadGood
wzxhzdk:74wzxhzdk:75

理论上: 结构的序列化形式是不同系统之间的契约。 对序列化表单结构(包括字段名)的更改会破坏此约定。在标记中指定字段名使约定明确, 它还可以通过重构或重命名字段来防止意外违反约定。

性能

性能方面的特定准则只适用于高频场景。

优先使用 strconv 而不是 fmt

将原语转换为字符串或从字符串转换时,

strconv

速度比

fmt

快。


BadGood
wzxhzdk:76wzxhzdk:77
wzxhzdk:78wzxhzdk:79

避免字符串到字节的转换

不要反复从固定字符串创建字节 slice。相反,请执行一次转换并捕获结果。

BadGood
wzxhzdk:80wzxhzdk:81
wzxhzdk:82wzxhzdk:83

指定容器容量

尽可能指定容器容量,以便为容器预先分配内存。这将在添加元素时最小化后续分配(通过复制和调整容器大小)。

指定 Map 容量提示

在尽可能的情况下,在使用

make()

初始化的时候提供容量信息


make(map[T1]T2, hint)

make()

提供容量提示会在初始化时尝试调整 map 的大小,这将减少在将元素添加到 map 时为 map 重新分配内存。


注意,与 slices 不同。map capacity 提示并不保证完全的抢占式分配,而是用于估计所需的 hashmap bucket 的数量。 因此,在将元素添加到 map 时,甚至在指定 map 容量时,仍可能发生分配。

BadGood
wzxhzdk:85wzxhzdk:86
`m` 是在没有大小提示的情况下创建的; 在运行时可能会有更多分配。`m` 是有大小提示创建的;在运行时可能会有更少的分配。

指定切片容量

在尽可能的情况下,在使用

make()

初始化切片时提供容量信息,特别是在追加切片时。


make([]T, length, capacity)

与 maps 不同,slice capacity 不是一个提示:编译器将为提供给

make()

的 slice 的容量分配足够的内存, 这意味着后续的 append()`操作将导致零分配(直到 slice 的长度与容量匹配,在此之后,任何 append 都可能调整大小以容纳其他元素)。


BadGood
wzxhzdk:88wzxhzdk:89
wzxhzdk:90wzxhzdk:91

规范

避免过长的行

避免使用需要读者水平滚动或过度转动头部的代码行。

我们建议将行长度限制为 99 characters (99 个字符). 作者应该在达到这个限制之前换行, 但这不是硬性限制。 允许代码超过此限制。

一致性

本文中概述的一些标准都是客观性的评估,是根据场景、上下文、或者主观性的判断;

但是最重要的是,保持一致.

一致性的代码更容易维护、是更合理的、需要更少的学习成本、并且随着新的约定出现或者出现错误后更容易迁移、更新、修复 bug

相反,在一个代码库中包含多个完全不同或冲突的代码风格会导致维护成本开销、不确定性和认知偏差。所有这些都会直接导致速度降低、代码审查痛苦、而且增加 bug 数量。

将这些标准应用于代码库时,建议在 package(或更大)级别进行更改,子包级别的应用程序通过将多个样式引入到同一代码中,违反了上述关注点。

相似的声明放在一组

Go 语言支持将相似的声明放在一个组内。

BadGood
wzxhzdk:92wzxhzdk:93

这同样适用于常量、变量和类型声明:

BadGood
wzxhzdk:94wzxhzdk:95

仅将相关的声明放在一组。不要将不相关的声明放在一组。

BadGood
wzxhzdk:96wzxhzdk:97

分组使用的位置没有限制,例如:你可以在函数内部使用它们:

BadGood
wzxhzdk:98wzxhzdk:99

例外:如果变量声明与其他变量相邻,则应将变量声明(尤其是函数内部的声明)分组在一起。对一起声明的变量执行此操作,即使它们不相关。

BadGood
wzxhzdk:100wzxhzdk:101

import 分组

导入应该分为两组:

  • 标准库
  • 其他库

默认情况下,这是 goimports 应用的分组。

BadGood
wzxhzdk:102wzxhzdk:103

包名

当命名包时,请按下面规则选择一个名称:

  • 全部小写。没有大写或下划线。
  • 大多数使用命名导入的情况下,不需要重命名。
  • 简短而简洁。请记住,在每个使用的地方都完整标识了该名称。
  • 不用复数。例如net/url
    ,而不是net/urls
  • 不要用“common”,“util”,“shared”或“lib”。这些是不好的,信息量不足的名称。

另请参阅 Go 包命名规则 和 Go 包样式指南.

函数名

我们遵循 Go 社区关于使用 MixedCaps 作为函数名 的约定。有一个例外,为了对相关的测试用例进行分组,函数名可能包含下划线,如:

TestMyFunction_WhatIsBeingTested

.


导入别名

如果程序包名称与导入路径的最后一个元素不匹配,则必须使用导入别名。

import (
  "net/http"

  client "example.com/client-go"
  trace "example.com/trace/v2"
)

在所有其他情况下,除非导入之间有直接冲突,否则应避免导入别名。

BadGood
wzxhzdk:105wzxhzdk:106

函数分组与顺序

  • 函数应按粗略的调用顺序排序。
  • 同一文件中的函数应按接收者分组。

因此,导出的函数应先出现在文件中,放在

struct

,

const

,

var

定义的后面。


在定义类型之后,但在接收者的其余方法之前,可能会出现一个

newXYZ()

/

NewXYZ()


由于函数是按接收者分组的,因此普通工具函数应在文件末尾出现。

BadGood
wzxhzdk:107wzxhzdk:108

减少嵌套

代码应通过尽可能先处理错误情况/特殊情况并尽早返回或继续循环来减少嵌套。减少嵌套多个级别的代码的代码量。

BadGood
wzxhzdk:109wzxhzdk:110

不必要的 else

如果在 if 的两个分支中都设置了变量,则可以将其替换为单个 if。

BadGood
wzxhzdk:111wzxhzdk:112

顶层变量声明

在顶层,使用标准

var

关键字。请勿指定类型,除非它与表达式的类型不同。


BadGood
wzxhzdk:113wzxhzdk:114

如果表达式的类型与所需的类型不完全匹配,请指定类型。

type myError struct{}

func (myError) Error() string { return "error" }

func F() myError { return myError{} }

var _e error = F()
// F 返回一个 myError 类型的实例,但是我们要 error 类型

对于未导出的顶层常量和变量,使用_作为前缀

在未导出的顶级

vars

consts

, 前面加上前缀_,以使它们在使用时明确表示它们是全局符号。


基本依据:顶级变量和常量具有包范围作用域。使用通用名称可能很容易在其他文件中意外使用错误的值。

BadGood
wzxhzdk:116wzxhzdk:117

例外:未导出的错误值可以使用不带下划线的前缀

err

。 参见错误命名。


结构体中的嵌入

嵌入式类型(例如 mutex)应位于结构体内的字段列表的顶部,并且必须有一个空行将嵌入式字段与常规字段分隔开。

BadGood
wzxhzdk:118wzxhzdk:119

内嵌应该提供切实的好处,比如以语义上合适的方式添加或增强功能。 它应该在对用户没有任何不利影响的情况下使用。(另请参见:避免在公共结构中嵌入类型)。

例外:即使在未导出类型中,Mutex 也不应该作为内嵌字段。另请参见:零值 Mutex 是有效的。

嵌入 不应该:

  • 纯粹是为了美观或方便。
  • 使外部类型更难构造或使用。
  • 影响外部类型的零值。如果外部类型有一个有用的零值,则在嵌入内部类型之后应该仍然有一个有用的零值。
  • 作为嵌入内部类型的副作用,从外部类型公开不相关的函数或字段。
  • 公开未导出的类型。
  • 影响外部类型的复制形式。
  • 更改外部类型的 API 或类型语义。
  • 嵌入内部类型的非规范形式。
  • 公开外部类型的实现详细信息。
  • 允许用户观察或控制类型内部。
  • 通过包装的方式改变内部函数的一般行为,这种包装方式会给用户带来一些意料之外情况。

简单地说,有意识地和有目的地嵌入。一种很好的测试体验是, "是否所有这些导出的内部方法/字段都将直接添加到外部类型" 如果答案是

some

no

,不要嵌入内部类型 - 而是使用字段。


BadGood
wzxhzdk:120wzxhzdk:121
wzxhzdk:122wzxhzdk:123
wzxhzdk:124wzxhzdk:125

本地变量声明

如果将变量明确设置为某个值,则应使用短变量声明形式 (

:=

)。


BadGood
wzxhzdk:126wzxhzdk:127

但是,在某些情况下,

var

使用关键字时默认值会更清晰。例如,声明空切片。


BadGood
wzxhzdk:128wzxhzdk:129

nil 是一个有效的 slice


nil

是一个有效的长度为 0 的 slice,这意味着,


  • 您不应明确返回长度为零的切片。应该返回nil
    来代替。


BadGood
go
if x == "" {
return []int{}
}
go
if x == "" {
return nil
}
  • 要检查切片是否为空,请始终使用len(s) == 0
    。而非 nil


BadGood
go
func isEmpty(s []string) bool {
return s == nil
}
go
func isEmpty(s []string) bool {
return len(s) == 0
}
  • 零值切片(用var
    声明的切片)可立即使用,无需调用make()
    创建。


BadGood
```go
nums := []int{}
// or, nums := make([]int)
if add1 {
nums = append(nums, 1)
}
if add2 {
nums = append(nums, 2)
}
```
```go
var nums []int
if add1 {
nums = append(nums, 1)
}
if add2 {
nums = append(nums, 2)
}
```

记住,虽然 nil 切片是有效的切片,但它不等于长度为 0 的切片(一个为 nil,另一个不是),并且在不同的情况下(例如序列化),这两个切片的处理方式可能不同。

缩小变量作用域

如果有可能,尽量缩小变量作用范围。除非它与 减少嵌套的规则冲突。

BadGood
wzxhzdk:130wzxhzdk:131

如果需要在 if 之外使用函数调用的结果,则不应尝试缩小范围。

BadGood
wzxhzdk:132wzxhzdk:133

避免参数语义不明确 (Avoid Naked Parameters)

函数调用中的

意义不明确的参数

可能会损害可读性。当参数名称的含义不明显时,请为参数添加 C 样式注释 (

/* ... */

)


BadGood
wzxhzdk:134wzxhzdk:135

对于上面的示例代码,还有一种更好的处理方式是将上面的

bool

类型换成自定义类型。将来,该参数可以支持不仅仅局限于两个状态(true/false)。


type Region int

const (
  UnknownRegion Region = iota
  Local
)

type Status int

const (
  StatusReady Status= iota + 1
  StatusDone
  // Maybe we will have a StatusInProgress in the future.
)

func printInfo(name string, region Region, status Status)

使用原始字符串字面值,避免转义

Go 支持使用 原始字符串字面值,也就是 " ` " 来表示原生字符串,在需要转义的场景下,我们应该尽量使用这种方案来替换。

可以跨越多行并包含引号。使用这些字符串可以避免更难阅读的手工转义的字符串。

BadGood
wzxhzdk:137wzxhzdk:138

初始化结构体

使用字段名初始化结构

初始化结构时,几乎应该始终指定字段名。目前由 [

go vet

] 强制执行。


BadGood
wzxhzdk:139wzxhzdk:140

例外:当有 3 个或更少的字段时,测试表中的字段名may可以省略。

tests := []struct{
  op Operation
  want string
}{
  {Add, "add"},
  {Subtract, "subtract"},
}

省略结构中的零值字段

初始化具有字段名的结构时,除非提供有意义的上下文,否则忽略值为零的字段。 也就是,让我们自动将这些设置为零值

BadGood
wzxhzdk:142wzxhzdk:143

这有助于通过省略该上下文中的默认值来减少阅读的障碍。只指定有意义的值。

在字段名提供有意义上下文的地方包含零值。例如,表驱动测试 中的测试用例可以受益于字段的名称,即使它们是零值的。

tests := []struct{
  give string
  want int
}{
  {give: "0", want: 0},
  // ...
}

对零值结构使用 var

如果在声明中省略了结构的所有字段,请使用

var

声明结构。


BadGood
wzxhzdk:145wzxhzdk:146

这将零值结构与那些具有类似于为 初始化 Maps 创建的,区别于非零值字段的结构区分开来, 并与我们更喜欢的 声明空切片 方式相匹配。

初始化 Struct 引用

在初始化结构引用时,请使用

&T{}

代替

new(T)

,以使其与结构体初始化一致。


BadGood
wzxhzdk:147wzxhzdk:148

初始化 Maps

对于空 map 请使用

make(..)

初始化, 并且 map 是通过编程方式填充的。 这使得 map 初始化在表现上不同于声明,并且它还可以方便地在 make 后添加大小提示。


BadGood
wzxhzdk:149wzxhzdk:150
声明和初始化看起来非常相似的。声明和初始化看起来差别非常大。

在尽可能的情况下,请在初始化时提供 map 容量大小,详细请看 指定 Map 容量提示。

另外,如果 map 包含固定的元素列表,则使用 map literals(map 初始化列表) 初始化映射。

BadGood
wzxhzdk:151wzxhzdk:152

基本准则是:在初始化时使用 map 初始化列表 来添加一组固定的元素。否则使用

make

(如果可以,请尽量指定 map 容量)。


字符串 string format

如果你在函数外声明

Printf

-style 函数的格式字符串,请将其设置为

const

常量。


这有助于

go vet

对格式字符串执行静态分析。


BadGood
wzxhzdk:153wzxhzdk:154

命名 Printf 样式的函数

声明

Printf

-style 函数时,请确保

go vet

可以检测到它并检查格式字符串。


这意味着您应尽可能使用预定义的

Printf

-style 函数名称。

go vet

将默认检查这些。有关更多信息,请参见 Printf 系列。


如果不能使用预定义的名称,请以 f 结束选择的名称:

Wrapf

,而不是

Wrap

go vet

可以要求检查特定的 Printf 样式名称,但名称必须以

f

结尾。


$ go vet -printfuncs=wrapf,statusf

编程模式

表驱动测试

当测试逻辑是重复的时候,通过 subtests 使用 table 驱动的方式编写 case 代码看上去会更简洁。

BadGood
wzxhzdk:156wzxhzdk:157

很明显,使用 test table 的方式在代码逻辑扩展的时候,比如新增 test case,都会显得更加的清晰。

我们遵循这样的约定:将结构体切片称为

tests

。 每个测试用例称为

tt

。此外,我们鼓励使用

give

want

前缀说明每个测试用例的输入和输出值。


tests := []struct{
  give     string
  wantHost string
  wantPort string
}{
  // ...
}

for _, tt := range tests {
  // ...
}

并行测试,比如一些专门的循环(例如,生成goroutine或捕获引用作为循环体的一部分的那些循环) 必须注意在循环的范围内显式地分配循环变量,以确保它们保持预期的值。

tests := []struct{
  give string
  // ...
}{
  // ...
}
for _, tt := range tests {
  tt := tt // for t.Parallel
  t.Run(tt.give, func(t *testing.T) {
    t.Parallel()
    // ...
  })
}

在上面的例子中,由于下面使用了

t.Parallel()

,我们必须声明一个作用域为循环迭代的

tt

变量。 如果我们不这样做,大多数或所有测试都会收到一个意外的

tt

值,或者一个在运行时发生变化的值。


功能选项

功能选项是一种模式,您可以在其中声明一个不透明 Option 类型,该类型在某些内部结构中记录信息。您接受这些选项的可变编号,并根据内部结构上的选项记录的全部信息采取行动。

将此模式用于您需要扩展的构造函数和其他公共 API 中的可选参数,尤其是在这些功能上已经具有三个或更多参数的情况下。

BadGood
wzxhzdk:160wzxhzdk:161
必须始终提供缓存和记录器参数,即使用户希望使用默认值。


wzxhzdk:162
只有在需要时才提供选项。


wzxhzdk:163

我们建议实现此模式的方法是使用一个

Option

接口,该接口保存一个未导出的方法,在一个未导出的

options

结构上记录选项。


type options struct {
  cache  bool
  logger *zap.Logger
}

type Option interface {
  apply(*options)
}

type cacheOption bool

func (c cacheOption) apply(opts *options) {
  opts.cache = bool(c)
}

func WithCache(c bool) Option {
  return cacheOption(c)
}

type loggerOption struct {
  Log *zap.Logger
}

func (l loggerOption) apply(opts *options) {
  opts.logger = l.Log
}

func WithLogger(log *zap.Logger) Option {
  return loggerOption{Log: log}
}

// Open creates a connection.
func Open(
  addr string,
  opts ...Option,
) (*Connection, error) {
  options := options{
    cache:  defaultCache,
    logger: zap.NewNop(),
  }

  for _, o := range opts {
    o.apply(&options)
  }

  // ...
}

注意:还有一种使用闭包实现这个模式的方法,但是我们相信上面的模式为作者提供了更多的灵活性,并且更容易对用户进行调试和测试。特别是,在不可能进行比较的情况下它允许在测试和模拟中对选项进行比较。此外,它还允许选项实现其他接口,包括

fmt.Stringer

,允许用户读取选项的字符串表示形式。


还可以参考下面资料:

Linting

比任何 "blessed" linter 集更重要的是,lint 在一个代码库中始终保持一致。

我们建议至少使用以下 linters,因为我认为它们有助于发现最常见的问题,并在不需要规定的情况下为代码质量建立一个高标准:

Lint Runners

我们推荐 golangci-lint 作为 go-to lint 的运行程序,这主要是因为它在较大的代码库中的性能以及能够同时配置和使用许多规范。这个 repo 有一个示例配置文件 .golangci.yml 和推荐的 linter 设置。

golangci-lint 有 various-linters 可供使用。建议将上述 linters 作为基本 set,我们鼓励团队添加对他们的项目有意义的任何附加 linters。