Golang抢占式调度

在1.12版本之前,go的调度器不支持抢占式调度,程序只能依靠Goroutine主动让出CPU资源才能触发调度,会引发一些问题,如

  • 某些Goroutine可以长时间占用线程,造成其它 Goroutine的饥饿
  • 垃圾回收器是需要stop the world的。如果垃圾回收器想要运行了,那么它必须先通知其它的goroutine合作停下来,这会造成较长时间的等待时间。

基于协作的抢占式调度

Goroutine引入了stackguard0字段,当该字段设置为StackPreempt意味着当前Goroutine发出了抢占请求;同时在runtime.newstack:1e112cd中增加抢占的代码,当stackguard0等于StackPreempt时触发调度器抢占让出线程。

gorogoutine创建之初,栈的大小是固定的,为了防止栈溢出,编译器会在有明显栈消耗的函数头部插入一些检测代码,通过stackguard0值来决定是否触发runtime.morestack函数。将stackguard0设置为StackPreempt作用是进入函数时必定触发runtime.morestack,然后在调用runtime.newstack。

工作机制

  • 编译器会在调用函数前插入runtime.morestack,可能会调用runtime.newstack进行抢占
  • Go语言运行时会在垃圾回收暂停程序、系统监控发现Goroutine运行超过10ms时发出抢占请求StackPreempt
  • 当发生函数调用时,可能会执行编译器插入的runtime.morestack,它调用的runtime.newstack会检查Goroutine的stackguard0字段是否为 StackPreempt;
  • 如果stackguard0是StackPreempt,就会触发抢占让出当前线程;

但是这种调度并不完备,比如一个goroutine运行了很久,但是它并没有调用另一个函数,则它不会被抢占。

基于信号的抢占式调度

在之前的依赖栈增长检测代码的方式,遇到没有函数调用的情况下就会出现问题,在Go1.14这一问题得到解决。
在Linux中这种真正的抢占式调度是基于信号完成的,所以也称为“异步抢占”。

工作机制

  • M注册一个SIGURG信号的处理函数:sighandler。
  • sysmon线程检测到执行时间过长的goroutine或者GC stw时,会向相应的M(或者说线程,每个线程对应一个 M)发送SIGURG信号。
  • 收到信号后,内核执行sighandler函数,通过pushCall插入asyncPreempt函数调用。
  • 回到当前goroutine执行asyncPreempt函数,通过mcall切到g0栈执行gopreempt_m。
  • 将当前goroutine插入到全局可运行队列,M则继续寻找其他goroutine来运行。
  • 被抢占的goroutine再次调度过来执行时,会继续原来的执行流。

基于信号的抢占式调度,抢占也只会在垃圾回收扫描任务时触发。