为什么要有sync.errgroup
go支持并发,一般采用的是 channel 、 sync.WaitGroup 、context,来实现各个协程之间的流程控制和消息传递。
但是对于开启的成千上万的协程,如果在每个协程内都自行去打印 错误日志的话,会造成日志分散,不好分析。
所以我们要实现一种能统一处理各个协程错误的工具
什么是 sync.errgroup
Go团队在实验仓库中添加了一个名为sync.errgroup的新软件包。 sync.ErrGroup再sync.WaitGroup功能的基础上,增加了错误传递,以及在发生不可恢复的错误时取消整个goroutine集合,或者等待超时
主要是利用了 waitgroup,context以及sync.Once,对这三个不熟悉的应先去看下相应的知识点
获取方法
go get golang.org/x/syncerrgroup 的功能
1、处理子协程 error
func main() { var g errgroup.Group // 声明一个group实例 var urls = []string{ "http://www.golang.org/", "http://www.google.com/", "http://www.somestupidname.com/", } for _, url := range urls { // 分别获取网站内容 url := url // url是局部变量,for循环中对多个协程传递值时,需要重新进行赋值 g.Go(func() error { // group 的go方法,启一个协程去执行代码 // Fetch the URL. resp, err := http.Get(url) if err == nil { resp.Body.Close() } return err }) } if err := g.Wait(); err == nil { // group 的wait方法,等待上面的 g.go的协程执行完成,并且可以接受错误 fmt.Println("Successfully fetched all URLs.") } }
上面这个例子是简单的利用 errgroup 进行的 waitGroup和error的处理,下面我们对关键的代码做一个分析,并结合源码来看
var g errgroup.Group
声明一个 group的实例,我们看下 group 包含哪些东西
type Group struct { cancel func() wg sync.WaitGroup errOnce sync.Once err error }
group是一个结构体,包含四个部分
- cancel 一个取消的函数,主要来包装context.WithCancel的CancelFunc
- wg 借助于WaitGroup实现的
- errOnce 使用sync.Once实现只输出第一个err
- err 记录下错误的信息
g.Go(func() error {}
启动goroutine 执行代码
记录第一个出错的goroutine的err信息。我们看下源码
func (g *Group) Go(f func() error) { g.wg.Add(1) // 和WaitGroup 一样,每执行一个新的g,通过add方法 加1 go func() { defer g.wg.Done() // 执行结束后 调用 Done方法,减1 if err := f(); err != nil { // 执行传入的匿名函数 g.errOnce.Do(func() { // 如果匿名函数返回错误,会记录错误信息。注意这里用的 once.Do,只执行一次,仅会记录第一个出现的err g.err = err if g.cancel != nil { // 如果初始化的有 cancel 函数,会调用 cancel退出 g.cancel() } }) } }() }
再来看下 g.Wait()
func (g *Group) Wait() error { g.wg.Wait() // 和 WaitGroup 一样,在主线程调用 wait 方法,阻塞等待所有g执行完成 if g.cancel != nil { // 如果初始化了 cancel 函数,就执行 g.cancel() } return g.err // 返回第一个出现的err信息 }
2、结合 context 来使用
package main import ( "context" "fmt" "golang.org/x/sync/errgroup" "time" ) func main() { ctx, cancel := context.WithCancel(context.Background()) group, errCtx := errgroup.WithContext(ctx) for index := 0; index < 3; index++ { indexTemp := index // 新建子协程 group.Go(func() error { fmt.Printf("indexTemp=%d \n", indexTemp) if indexTemp == 0 { // 第一个协程 fmt.Println("indexTemp == 0 start ") fmt.Println("indexTemp == 0 end") } else if indexTemp == 1 { // 第二个协程 fmt.Println("indexTemp == 1 start") //这里一般都是某个协程发生异常之后,调用cancel() //这样别的协程就可以通过errCtx获取到err信息,以便决定是否需要取消后续操作 cancel() // 第二个协程异常退出 fmt.Println("indexTemp == 1 err ") } else if indexTemp == 2 { fmt.Println("indexTemp == 2 begin") // 休眠1秒,用于捕获子协程2的出错 time.Sleep(1 * time.Second) //检查 其他协程已经发生错误,如果已经发生异常,则不再执行下面的代码 err := CheckGoroutineErr(errCtx) // 第三个协程感知第二个协程是否正常 if err != nil { return err } fmt.Println("indexTemp == 2 end ") } return nil }) } // 捕获err err := group.Wait() if err == nil { fmt.Println("都完成了") } else { fmt.Printf("get error:%v", err) } } //校验是否有协程已发生错误 func CheckGoroutineErr(errContext context.Context) error { select { case <-errContext.Done(): return errContext.Err() default: return nil } }