漫谈Go语言编译器（01）

开场白

我（史斌）曾在Gopher China 2020大会上分享过《Go语言编译器简介》（https://github.com/gopherchina/conference/tree/master/2020）。当时仅仅是泛泛的浏览了一下Go编译器，但其实每一页PPT都能单独展开讲。因此我准备写一系列文章，把当时未能详细阐述的内容补充一下。

欢迎转载扩散，但请标注原创出自公众号："Golang Contributor Club"。

为什么学习编译器

编译器对多数人是一个黑盒，只需了解命令行参数即可；但我认为深入了解编译器的内部有很多好处。

第一个好处是：了解编译器能让gopher深入了解Go程序的运行机制，从而写出更优质的代码。

第二个好处是：能提升gopher的内功。编译器涉及正则表达式，树搜索/树变换，有向图变换/有向图搜索；这些对于写上层业务逻辑的gopher以前是虚幻的屠龙术，但是阅读编译器源码后，你会发现它们其实很实用。

第三个好处是：你有机会接触汇编语言，以及各个硬件平台的特点。ARM64服务器已经成为一种趋势，已经在部分场景取代了X86_64服务器。所以我们需要了解不同的硬件平台的特点。

第四个好处是：编译器会是未来的一个热门行业。因为美国的制裁，当下是国内芯片行业的春天，加强中国芯的建设已经成为一个政治任务。而处理器（CPU/GPU/NPU/TPU/.../xPU）作为芯片领域的重要分支，是需要编译器支持的。当前国内编译器领域严重缺人，因为入门难度高，起薪自然比其它容易入门的领域高。（我的团队长期招人，欢迎砸简历。）

第五个好处是：你可以基于Go编译器定制自己的编程语言。Go编译器从go-1.7开始已经实现模块化，这意味着你可以自己设计一个全新的编程语言（甚至不兼容Go语法），借助Go编译器编译成一个可执行程序。

阅读前的准备

虽然本系列的定位是科普文，但是我也不准备从最基本的正则表达式，语法树，有向图等最基础的知识讲起；因此假设读者有一定的知识基础。

在这个前提下，我希望你看过我在Gopher China 2020上的讲座，并阅读过PPT（https://github.com/gopherchina/conference/tree/master/2020）。

除此之外，我希望你阅读过柴树杉大神写的《Go语法树入门》（https://github.com/chai2010/go-ast-book），这是关于编译前端非常优秀的入门书籍。在此基础上，本系列的重点是讲解编译中端和后端。

坦白地说，编译器确实是最难入门的领域；同时也是最难写科普文的领域：专业人士看了觉得浅显，没相关基础的读者看了觉得云山雾罩。虽然如此，我还是想挑战一下。希望能收到读者更多反馈，我会据此调节讲解的内容。

基础知识回顾

目前成熟的生产环境用的编译器，都是基于久经考验的前中后三阶段架构。

其中前端将高级语言的源代码翻译成IR（Intermediate Representation）序列，并传递给中端；中端对输入的原始IR序列做通用优化，并输出优化后的IR序列给后端；后端接收中端传来的IR序列，将其映射成真正的汇编指令序列，并做进一步和硬件相关的特殊优化。最终经过链接生成可执行程序。

这种架构的第一个好处是：新的高级语言无需支持所有的硬件，仅需生成IR即可；新的硬件无需适配所有的高级编程语言，仅需适配IR即可。从因果关系上看，前端和后端各自都是一个子编译器，前端把高级语言编译成IR序列，IR对于前端就是（伪）汇编；而后端把IR编译成真汇编，IR对于后端就是（伪）高级语言。

这种架构的第二个好处是：避免重复性的优化。例如把'a*8'优化成'a<<3'在所有的硬件上都适用。因此没必要每个后端都做一遍，把这个优化放在中端一次性完成即可。

这种架构的第三个好处是：针对SSA（Single Static Assignment）形态的IR，已经有无数计算机科学家做了大量细致的研究，有非常成熟的优化算法可以借鉴。编译原理最经典的教材龙书的作者，就因为在此领域的开创性贡献获得了2021年度的图灵奖。

Go编译器

Go编译器在go-1.7之前，采用的是非常老旧的语法树（AST）覆盖的编译技术，从go-1.7开始逐步采用更主流的基于SSA-IR的前中后三阶段编译技术。虽然Go编译器无需支持别的高级编程语言，但是上述的第二点和第三点好处仍然适用。

一个额外的好处是，Go编译器的中端和后端被做成了独立的库"golang.org/x/tools/go/ssa"。这就意味着，你可以自己写一个新的语言前端（甚至不兼容Go语法），并调用Go的ssa库，生成可执行程序；甚至于你自己定义的编程语言可以无缝地调用其它Go的代码；进一步，你可以借助于Go的生态系统打造自己的编程语言！类似于Scala语言和Java语言的关系。

SSA-IR

SSA-IR（Single Static Assignment）是一种介于高级语言和汇编语言的中间形态的伪语言，从高级语言角度看，它是（伪）汇编；而从真正的汇编语言角度看，它是（伪）高级语言。

顾名思义，SSA（Single Static Assignment）的两大要点是：

Static：每个变量只能赋值一次（因此应该叫常量更合适）；
Single：每个表达式只能做一个简单运算，对于复杂的表达式a*b+c*d要拆分成："t0=a*b; t1=c*d; t2=t0+t1;"三个简单表达式；

例如有如下Go源代码：

func foo(a, b int) int {
  c := 8
  return a*4 + b*c
}

它改写成SSA形式是：

func foo(a, b int) int {
  c := 8
  t0 := a * 4
  t1 := b * c
  t2 := t0 + t1
  return t2
}

它被中端优化后的SSA形式是：

func foo(a, b int) int {
  t0 := a << 2
  t1 := b << 3
  t2 := t0 + t1
  return t2
}

说到这里，敏感的读者可能会问：如果只有赋值，那么程序岂不是只有顺序结构，而分支结构和循环结构是如何支持的？因此这里要提前剧透一点，Go编译器的IR不仅有SSA，还有if-goto指令；Go语言的if语句和for循环语句，都是会被编译成if-goto指令。事实上在结构化编程（顺序/分支/循环）概念出现之前，就是因为goto语句的滥用而导致了1960年代的第一次软件工程危机。说白了程序运行实际上还是依赖goto，而if/for语句只是为了让程序更具有可读性，减少潜在bug。下面是一个小例子：

func foo(a, b int) int {
  if (a > b) {
    return a + b
  } else {
    return a - b
}

它被编译器前端翻译成IR后是如下形态（注意：if-goto-else-goto是一个整体的单条指令，条件/真目的地/假目的地是它的三个操作数，就像除法指令有被除数和除数两个操作数一样）：

func foo(a, b int) int {
  c := a > b
  if (c) goto _true; else goto _false;


_true:
  t0 := a + b
  return t0


_false:
  t1 := a - b
  return t1
}

后续文章会逐步对Go的IR做完整的介绍。这里举两个最简单的例子，便于读者快速了解IR的核心概念和常见形态。

实操

Go编译器提供了完备的调试手段，正好我们可以借用过来展示Go编译器的内部工作流程。本系列文章使用go-1.14.15做演示，请读者安装此版本。

下面用一个例子test.go：

// test.go
package main


func foo(a, b int) int {
  c := 8
  return a*4 + b*c
}


func main() {
  println(foo(100, 150))
}

使用如下命令编译，在得到可执行目标程序的同时，还会得到一个额外的ssa.html，这个ssa.html就记录了Go编译器的工作流程和各阶段的中间结果。其中GOSSAFUNC环境变量用于指定需要被调试的函数，本例中是foo。

$ GOSSAFUNC=foo go build a.go
# command-line-arguments
dumped SSA to ./ssa.html

打开ssa.html，可以看到编译foo函数一共经过了40多道工序。

其中，source和AST属于编译器前端，从start到writebarrier属于编译器中端，从lower到genssa属于编译器后端。

这其中的start/writebarrier/genssa三道工序的输出，请读者认真看一下。

start工序是编译器前端的最后一步，输出原始IR序列，请读者对照源码仔细体会。v10对应变量c，v11对应第一个乘法运算的乘数4，v12是第一个乘法的积，v13是第二个乘法的积，v14是加法的和。

start


b1:
v1 (?) = InitMem <mem>
v2 (?) = SP <uintptr>
v3 (?) = SB <uintptr>
v4 (?) = LocalAddr <*int> {a} v2 v1
v5 (?) = LocalAddr <*int> {b} v2 v1
v6 (?) = LocalAddr <*int> {~r2} v2 v1
v7 (4) = Arg <int> {a} (a[int])
v8 (4) = Arg <int> {b} (b[int])
v9 (?) = Const64 <int> [0]
v10 (?) = Const64 <int> [8] (c[int])
v11 (?) = Const64 <int> [4]
v12 (6) = Mul64 <int> v7 v11
v13 (6) = Mul64 <int> v8 v10
v14 (6) = Add64 <int> v12 v13
v15 (6) = VarDef <mem> {~r2} v1
v16 (6) = Store <mem> {int} v6 v14 v15
Ret v16 (+6)

writebarrier是编译器中端的最后一步，输出经通用优化后的IR序列。读者可以看到，最初的乘法运算（Mul64）被优化成了移位运算（Lsh64x64）。

writebarrier [549 ns]


b1:
v1 (?) = InitMem <mem>
v2 (?) = SP <uintptr>
v6 (?) = LocalAddr <*int> {~r2} v2 v1
v7 (4) = Arg <int> {a} (a[int])
v8 (4) = Arg <int> {b} (b[int])
v15 (6) = VarDef <mem> {~r2} v1
v9 (+6) = Const64 <uint64> [2]
v5 (6) = Const64 <uint64> [3]
v12 (+6) = Lsh64x64 <int> [false] v7 v9
v13 (6) = Lsh64x64 <int> [false] v8 v5
v14 (6) = Add64 <int> v12 v13
v16 (6) = Store <mem> {int} v6 v14 v15
Ret v16 (+6)

而genssa是后端的最后一步，输出真正的最优的x86_64汇编序列。

小结和展望

本文介绍了理解Go编译器的所需背景知识，以及Go编译器的整体工作流程。后续的文章会逐步针对上面的各道工序展开讲解。