Golang Scheduler 调度器

Go 的运行时（Runtime）管理着调度、垃圾回收以及 goroutine 的运行环境，本次主要介绍调度器（scheduler）。

为什么需要调度器？主要是为了方便高并发程序的编写。线程是 CPU 调度的实体，但线程切换还是有一定代价的。Goroutine 更加轻量，程序员只需要面对 Goroutine，由 scheduler 将 Goroutine 调度到线程上执行。

所谓 M:N 模型就是指，N 个 goroutine 在 M 个线程上执行。

goroutine 和线程的区别

内存占用

创建一个 goroutine 的栈内存消耗为 2 KB，实际运行过程中，如果栈空间不够用，会自动进行扩容。创建一个 thread 则需要消耗 1 MB 栈内存，而且还需要一个被称为 “a guard page” 的区域用于和其他 thread 的栈空间进行隔离。

对于一个用 Go 构建的 HTTP Server 而言，对到来的每个请求，创建一个 goroutine 用来处理是非常轻松的一件事。而如果用一个使用线程作为并发原语的语言构建的服务，例如 Java 来说，每个请求对应一个线程则太浪费资源了，很快就会出 OOM 错误（OutOfMermoryError）。

创建和销毀

Thread 创建和销毀都会有巨大的消耗，因为要和操作系统打交道，是内核级的，通常解决的办法就是线程池。而 goroutine 因为是由 Go runtime 负责管理的，创建和销毁的消耗非常小，是用户级。

切换

当 threads 切换时，需要保存各种寄存器，以便将来恢复：

16 general purpose registers, PC (Program Counter), SP (Stack Pointer), segment registers, 16 XMM registers, FP coprocessor state, 16 AVX registers, all MSRs etc.

而 goroutines 切换只需保存三个寄存器：Program Counter, Stack Pointer and BP。

一般而言，线程切换会消耗 1000-1500 纳秒，一个纳秒平均可以执行 12-18 条指令。所以由于线程切换，执行指令的条数会减少 12000-18000。

Goroutine 的切换约为 200 ns，相当于 2400-3600 条指令。

因此，goroutines 切换成本比 threads 要小得多。

调度器：M，P 和 G

mpg

ggmmmpmpg

早期版本的Golang是没有P的，调度是由G与M完成。这样的问题在于每当创建、终止Goroutine或者需要调度时，需要一个全局的锁来保护调度的相关对象。全局锁严重影响Goroutine的并发性能。

gmp

pggp

gpgm

runtime.fundrunnable()pppg

系统调用

ggmpmpgpm

ggp

抢占式调度

在 Go1.14 之前，是基于协作的抢占式调度。 runtime 在程序启动时，会自动创建一个系统线程，运行 sysmon() 函数，在整个程序生命周期中一直执行。sysmon()会调用retake()函数，retake()函数会遍历所有的P，如果一个P处于执行状态，且已经连续执行了较长时间，就会设置它的抢占标志位，这将导致该P中正在执行的G进行下一次函数调用时，会通过调用dropg()将G与M解除绑定；再调用globrunqput()将G加入全局runnable队列中。最后调用schedule() 来用为当前P设置新的可执行的G。

time.Sleep()