虽然golang中协程开销很低,但是在一些情况下还是有必要限制一下协程的开启数,比如爬虫中的下载协程,因为受到带宽限制,开的多了也没有效果。本来想在网上找找有没协程池,类似其它语言线程池这样的东西,可以限制最大开启数。找了一番,这方面的资料非常少,难道golang不需要协程池这种东东?自己动手写一个吧。
要限制协程最大数量,就是考虑开启一个协程的时候记录一下,然后超过最大数就不再开启。可以考虑用一个变量count来记录协程开启数量,不过这种方式比较out了,golang中可以用channel来实现。
不限制的代码:
package main import ( "fmt" "strconv" "time" ) // 模拟下载页面的方法 func download(url string) { fmt.Println("download from ",url) } func main() { urls := [100]string{} for i := 0; i < 100; i++ { urls[i] = "url" + strconv.Itoa(i) } for i := 0; i < len(urls); i++ { go download(urls[i]) } // 休眠一下 for { time.Sleep(1 * 1e9) } }
根据url数量开启若干协程,每个协程会去下载页面内容,通常受到带宽的限制,协程开多了没有什么提升效果。
限制一下
package main import ( "fmt" "strconv" "time" ) var ( maxRoutineNum = 10 ) // 模拟下载页面的方法 func download(url string,ch chan int) { fmt.Println("download from ",url) // 休眠两秒模拟下载页面 time.Sleep(2 * 1e9) // 下载完成则从ch推出数据 <-ch } func main() { ch := make(chan int,maxRoutineNum) urls := [100]string{} for i := 0; i < 100; i++ { urls[i] = "url" + strconv.Itoa(i) } for i := 0; i < len(urls); i++ { // 开启下载协程前往ch塞一个数据 // 如果ch满了则会处于阻塞,从而达到限制最大协程的功能 ch <- 1 go download(urls[i],ch) } // 休眠一下 for { time.Sleep(1 * 1e9) } }
主要就是用golang中channel的阻塞性和最大数量处理,可以考虑封装一下提供使用。
golang真的不需要协程池?