Go 项目中使用熔断技术提高系统容错性。本文介绍了 go 熔断器和其使用。

熔断器像是一个保险丝。当我们依赖的服务出现问题时,可以及时容错。一方面可以减少依赖服务对自身访问的依赖,防止出现雪崩效应;另一方面降低请求频率以方便上游尽快恢复服务。

github/sony/gobreakergithub/lpflpf/gobreaker

熔断器的模式

gobreaker 是基于《微软云设计模式》一书中的熔断器模式的 Golang 实现。有 sony 公司开源,目前 star 数有 1.2K。使用人数较多。

下面是模式定义的一个状态机:

538bb7b4-4e2d-11ec-9eda-dac502259ad0.png

熔断器有三种状态,四种状态转移的情况:

三种状态

  • 熔断器关闭状态,服务正常访问

  • 熔断器开启状态,服务异常

  • 熔断器半开状态,部分请求限流访问

四种状态转移

  • 在熔断器关闭状态下,当失败后并满足一定条件后,将直接转移为熔断器开启状态。

  • 在熔断器开启状态下,如果过了规定的时间,将进入半开启状态,验证目前服务是否可用。

  • 在熔断器半开启状态下,如果出现失败,则再次进入关闭状态。

  • 在熔断器半开启后,所有请求(有限额)都是成功的,则熔断器关闭。所有请求将正常访问。

gobreaker 的实现

gobreaker 是在上述状态机的基础上,实现的一个熔断器。

熔断器的定义

typeCircuitBreakerstruct{
namestring
maxRequestsuint32//最大请求数(半开启状态会限流)
intervaltime.Duration//统计周期
timeouttime.Duration//进入熔断后的超时时间
readyToTripfunc(countsCounts)bool//通过Counts判断是否开启熔断。需要自定义
onStateChangefunc(namestring,fromState,toState)//状态修改时的钩子函数

mutexsync.Mutex//互斥锁,下面数据的更新都需要加锁
stateState//记录了当前的状态
generationuint64//标记属于哪个周期
countsCounts//计数器,统计了成功、失败、连续成功、连续失败等,用于决策是否进入熔断
expirytime.Time//进入下个周期的时间
}

其中,如下参数是我们可以自定义的:

  • MaxRequests:最大请求数。当在最大请求数下,均请求正常的情况下,会关闭熔断器

  • interval:一个正常的统计周期。如果为 0,那每次都会将计数清零

  • timeout: 进入熔断后,可以再次请求的时间

  • readyToTrip:判断熔断生效的钩子函数

  • onStateChagne:状态变更的钩子函数

请求的执行

熔断器的执行操作,主要包括三个阶段;①请求之前的判定;②服务的请求执行;③请求后的状态和计数的更新

//熔断器的调用
func(cb*CircuitBreaker)Execute(reqfunc()(interface{},error))(interface{},error){

//①请求之前的判断
generation,err:=cb.beforeRequest()
iferr!=nil{
returnnil,err
}

deferfunc(){
e:=recover()
ife!=nil{
//③panic的捕获
cb.afterRequest(generation,false)
panic(e)
}
}()

//②请求和执行
result,err:=req()

//③更新计数
cb.afterRequest(generation,err==nil)
returnresult,err
}

请求之前的判定操作

请求之前,会判断当前熔断器的状态。如果熔断器以开启,则不会继续请求。如果熔断器半开,并且已达到最大请求阈值,也不会继续请求。

func(cb*CircuitBreaker)beforeRequest()(uint64,error){
cb.mutex.Lock()
defercb.mutex.Unlock()

now:=time.Now()
state,generation:=cb.currentState(now)

ifstate==StateOpen{//熔断器开启,直接返回
returngeneration,ErrOpenState
}elseifstate==StateHalfOpen&&cb.counts.Requests>=cb.maxRequests{//如果是半打开的状态,并且请求次数过多了,则直接返回
returngeneration,ErrTooManyRequests
}

cb.counts.onRequest()
returngeneration,nil
}

其中当前状态的计算,是依据当前状态来的。如果当前状态为已开启,则判断是否已经超时,超时就可以变更状态到半开;如果当前状态为关闭状态,则通过周期判断是否进入下一个周期。

func(cb*CircuitBreaker)currentState(nowtime.Time)(State,uint64){
switchcb.state{
caseStateClosed:
if!cb.expiry.IsZero()&&cb.expiry.Before(now){//是否需要进入下一个计数周期
cb.toNewGeneration(now)
}
caseStateOpen:
ifcb.expiry.Before(now){
//熔断器由开启变更为半开
cb.setState(StateHalfOpen,now)
}
}
returncb.state,cb.generation
}

周期长度的设定,也是以据当前状态来的。如果当前正常(熔断器关闭),则设置为一个 interval 的周期;如果当前熔断器是开启状态,则设置为超时时间(超时后,才能变更为半开状态)。

请求之后的处理操作

每次请求之后,会通过请求结果是否成功,对熔断器做计数。

func(cb*CircuitBreaker)afterRequest(beforeuint64,successbool){
cb.mutex.Lock()
defercb.mutex.Unlock()

now:=time.Now()

//如果不在一个周期,就不再计数
state,generation:=cb.currentState(now)
ifgeneration!=before{
return
}

ifsuccess{
cb.onSuccess(state,now)
}else{
cb.onFailure(state,now)
}
}

如果在半开的状态下:

  • 如果请求成功,则会判断当前连续成功的请求数 大于等于 maxRequests, 则可以把状态由半开状态转移为关闭状态

  • 如果在半开状态下,请求失败,则会直接将半开状态转移为开启状态

如果在关闭状态下:

  • 如果请求成功,则计数更新

  • 如果请求失败,则调用 readyToTrip 判断是否需要将状态关闭状态转移为开启状态

总结

too many requests

转自:segmentfault.com/a/1190000023033343