goroutine是非常轻量的,不会暂用太多资源,基本上有多少任务,我们可以开多少goroutine去处理。但有时候,我们还是想控制一下。

比如,我们有A、B两类工作,不想把太多资源花费在B类务上,而是花在A类任务上。对于A,我们可以来1个开一个goroutine去处理,对于B,我们可以使用一个协程池,协程池里有5个 线程 去处理B类任务,这样B消耗的资源就不会太多。

控制使用资源并不是协程池目的, 使用协程池是为了更好并发、程序鲁棒性、容错性等 。废话少说,快速入门协程池才是这篇文章的目的。

协程池指的是预先分配固定数量的goroutine处理相同的任务 ,和 线程池 是类似的,不同点是协程池中处理任务的是协程,线程池中处理任务的是线程。

上面这个图展示了最简单的协程池的样子。先 把协程池作为一个整体看,它使用2个通道,左边的jobCh是任务通道,任务会从这个通道中流进来,右边的retCh是结果通道,协程池处理任务后得到的结果会写入这个通道 。至于协程池中,有多少 协程 处理任务,这是外部不关心的。

看一下 协程 池内部,图中画了5个goroutine,实际goroutine的数量是依具体情况而定的。 协程池内每个协程都从jobCh读任务、处理任务,然后将结果写入到retCh。

模型看懂了,看个小例子吧。

workerPool()会创建1个简单的协程池,协程的数量可以通入参数n执行,并且还指定了jobCh和retCh两个参数。

worker()是协程池中的协程,入参分布是它的ID、job通道和结果通道。使用for-range从jobCh读取任务,直到jobCh关闭,然后一个最简单的任务:生成1个 字符串 ,证明自己处理了某个任务,并把字符串作为结果写入retCh。

main()启动genJob获取存放任务的通道jobCh,然后创建retCh,它的缓存空间是200,并使用workerPool启动一个有5个协程的协程池。1s之后,关闭retCh,然后开始从retCh中读取协程池处理结果,并打印。

genJob启动一个协程,并生产n个任务,写入到jobCh。

示例运行结果如下,一共产生了10个任务,显示大部分工作都被worker 2这个协程抢走了,如果我们设置的任务成千上万,协程池长时间处理任务,每个协程处理的工作数量就会均衡很多。

最简单的协程池模型就这么简单,再回头看下协程池及周边由哪些组成:

  1. 协程池内的一定数量的 协程
  2. 任务队列 ,即jobCh,存在协程池不能立即处理任务的情况,所以需要队列把任务先暂存。
  3. 结果队列 ,即retCh,同上,协程池处理任务的结果,也存在不能被下游立刻提取的情况,要暂时保存。

协程池最简要(核心)的逻辑是所有协程从任务读取任务,处理后把结果存放到结果队列。

本文所有示例源码,及历史文章、代码都存储在 Github :

原文: