在1.2版本之前,go的调度器仍然不支持抢占式调度,程序只能依靠Goroutine主动让出CPU资源才能触发调度,这会引发一些问题,比如:
- 某些 Goroutine 可以长时间占用线程,造成其它 Goroutine 的饥饿
- 垃圾回收器是需要stop the world的。如果垃圾回收器想要运行了,那么它必须先通知其它的goroutine合作停下来,这会造成较长时间的等待时间。
之后go team意识到这个问题,首先推出了基于协作的抢占式调度
基于协作的抢占式调度
stackguard0StackPreemptruntime.newstack:1e112cdstackguard0StackPreempt
1.13版本 go依赖调用函数栈增长检测代码的方式
stackguard0runtime.morestackstackguard0StackPreemptruntime.morestackruntime.newstack
所以基于协作的抢占式调度的工作机制就是:
runtime.morestackruntime.newstackStackPreemptruntime.morestackruntime.newstackstackguard0StackPreemptstackguard0StackPreempt
但是这种调度并不完备,比如一个goroutine运行了很久,但是它并没有调用另一个函数,则它不会被抢占。例如
这段代码在这种调度方式下会阻塞,是因为空的for循环没有调用函数
在Go的1.14版本中实现了非协作的抢占式调度
基于信号的抢占式调度
在之前的依赖栈增长检测代码的方式,遇到没有函数调用的情况下就会出现问题,在Go1.14这一问题得到解决。
在Linux中这种真正的抢占式调度是基于信号完成的,所以也称为“异步抢占”
“异步抢占”工作机制:
-
M 注册一个 SIGURG 信号的处理函数:sighandler。
-
sysmon 线程检测到执行时间过长的 goroutine 或者GC stw 时,会向相应的 M(或者说线程,每个线程对应一个 M)发送 SIGURG 信号。
-
收到信号后,内核执行 sighandler 函数,通过 pushCall 插入 asyncPreempt 函数调用。
-
回到当前 goroutine 执行 asyncPreempt 函数,通过 mcall 切到 g0 栈执行 gopreempt_m。
-
将当前 goroutine 插入到全局可运行队列,M 则继续寻找其他 goroutine 来运行。
-
被抢占的 goroutine 再次调度过来执行时,会继续原来的执行流。
基于信号的抢占式调度,抢占也只会在垃圾回收扫描任务时触发