goroutine简介
golang语言作者Rob Pike说,“Goroutine是一个与其他goroutines 并发运行在同一地址空间的Go函数或方法。一个运行的程序由一个或更多个goroutine组成。它与线程、协程、进程等不同。它是一个goroutine“。
- goroutine通过通道来通信,而协程通过让出和恢复操作来通信;
- goroutine 通过Golang 的调度器进行调度,而协程通过程序本身调度;
简单的说就是Golang自己实现了协程并叫做goruntine(本文称Go协程),且比协程更强大。
goroutine调度原理
上面说到Go协程是通过Golang的调度器进行调度的,其中调度器的线程模型为两级线程模型。
有关两级线程模型的介绍,可以看这篇文章
我们来看下Golang实现的两级线程模型是怎样的。首先要知道这三个字母代表的含义
- M:代表内核级的线程
- P:全程Processor,代表运行Go协程所需要的资源(上下文环境)
- G:代表Go协程
我们先看下为实现调度Golang定义了这些数据结构存M,P,G
名称 | 作用范围 | 描述 |
---|---|---|
全局M列表 | Go的运行时 | 存放所有M的单向链表 |
全局P列表 | Go的运行时 | 存放所有P的数组 |
全局G列表 | Go的运行时 | 存放所有G的切片 |
调度器的空闲M列表 | 调度器 | 存放空闲M的单向链表 |
调度器的空闲P列表 | 调度器 | 存放空闲P的单向链表 |
调度器的自由G列表 | 调度器 | 存放自由G的单向链表(有两个) |
调度器的可运行G队列 | 调度器 | 存放可运行G的队列 |
P的自由G列表 | 本地P | 存放当前P中自由G的单向链表 |
P的可运行G队列 | 本地P | 存放当前P中可运行G的队列 |
然后从上往下解析Go的两级线程模型图
(1)M和内核线程之间是一对一的关系,一个M在其生命周期中,只会和一个内核线程关联,所以不会出现对内核线程的频繁切换;
调度器的空闲M列表
(2)P和M之间是多对多的关系,P和G之间是一对多的关系,他们的关联是易变的,由Golang的调度器完成调度;
Golang的运行时按规则调度,让P和不同的M建立或断开关联,使得P中的G能够及时获得运行时机
调度器的空闲P列表
可运行的G队列自由G列表
可运行的G队列自由G列表P的自由G列表调度器的自由G列表
可见Golang调度器在调度时很大程度复用了M,P,G
(5)在Go程序初始化后,调度器首先进行一轮调度,此时用M去搜索可运行的G。其中我们的main函数也是一个G,找到可运行的G后就执行它;
本地P的可运行的G队列调度器的可运行的G队列其他P的可运行的G队列
P的可运行G队列调度器的可运行G队列
系统监控
上面大概描述了关于goroutine调度的流程。现在还存在一个问题,那就是当Go协程很多(并发量大)时候,显然G是不能一直执行下去的,因为也需要把执行机会留给其他的G。此时Golang运行时的系统监控就起作用了。
一般情况,当G运行时间超过10ms后,该G就会被系统告知需要停止了,让其他G运行。(这里情况比较复杂,并不能确保每个G都能被公平执行)
以下特殊情况该G不需要停止
- P的可运行G队列为空(没有其他G可运行)
- 有空闲的M在寻找可运行的G(没有其他G可运行)
- 空闲的P(还有P闲着)
总结
Golang以两级线程实现模型,自己实现goruntine和调度器,优势在于并行和非常低的资源使用。
主要体现:
- 内存消耗方面(每个Go协程占的内存远小于线程占的内存)
- 切换(调度)开销方面
- 线程切换涉及模式切换(从用户态切换到内核态)
此外,Go协程执行任务完成的顺序并不都是按我们预期的那样(程序不加以控制的情况下),特别在一些耗时较长的任务中。且每个Go协程执行的时间也不是绝对公平的。
如有错误地方,还请狂喷!