目录正文最小堆时间轮总结正文在系统开发中,有一类任务不是立即执行,而是在未来某个时间点或者按照一定间隔去执行,比如日志定期压缩、报表制作、过期数据清理等,这就是定时任务。在单机中,定时任务通常需要实现...

目录
正文
最小堆
时间轮
总结

正文

在系统开发中,有一类任务不是立即执行,而是在未来某个时间点或者按照一定间隔去执行,比如日志定期压缩、报python表制作、过期数据清理等,这就是定时任务。

在单机中,定时任务通常需要实现一个类似crontab的系统,一般有两种方式:

最小堆,按照任务执行时间建堆,每次取最近的任务执行
时间轮,将任务放到时间轮列表中,每次转动取对应的任务列表执行

最小堆

最小堆是一种特殊的完全二叉树,任意非叶子节点的值不大于其子节点,如图

Golang分布式应用定时任务示例详解

通过最小堆,根据任务最近执行时间键堆,每次取堆顶元素即最近需要执行的任务,设置timer定时器,到期后触发任务执行。由于堆的特性每次调整的时间复杂度为O(lgN),相较于普通队列性能更快。

container/heap
// 运行
func (c *Cron) Run() error {
    // 设置cron已启动,atomic.Bool来保证并发安全
c.started.Store(true)
    // 主循环
for {
        // 如果停止则退出
if !c.started.Load() {
break
}
c.runTask()
}
return nil
}
// 核心逻辑
func (c *Cron) runTask() {
now := time.Now()
duration := infTime
// 获取堆顶元素
task, ok := c.tasks.Peek()
if ok {
// 如果已删除则弹出
if !c.set.Has(task.Name()) {
c.tasks.Pop()
return
}
// 计算于当前时间查找,设置定时器
if task.next.After(now) {
duration = task.next.Sub(now)
} else {
duration = 0
}
}
timer := time.NewTimer(duration)
defer timer.Stop()
// 当有新元素插入直接返回,防止新元素执行时间小于当前堆顶元素
select {
case <-c.new:
return
case <-timer.C:
}
// 弹出任务,执行
go task.Exec()
// 计算下次执行时间,如果为0说明任务已结束,否则重新入堆
task.next = task.Next(time.Now())
if task.next.IsZero() {
c.set.Delete(task.Name())
} else {
c.tasks.Push(task)
}
}

主要逻辑可总结为:

将任务按照下次执行时间建最小堆
每次取堆顶任务,设置定时器
如果中间有新加入任务,转入步骤2
定时器到期后执行任务
再次取下个任务,转入步骤2,依次执行

时间轮

另一种实现Cron的方式是时间轮,时间轮通过一个环形队列,每个插槽放入需要到期android执行的任务,按照固定间隔转动时间轮,取插槽中任务列表执行,如图所示:

Golang分布式应用定时任务示例详解

时间轮可看作一个表盘,如图中时间间隔为1秒,总共60个格子,如果任务在3秒后执行则放为插槽3,每秒转动次取插槽上所有任务执行。

如果执行时间超过最大插槽,比如有个任务需要63秒后执行(超过了最大格子刻度),一般可以通过多层时间轮,或者设置一个额外变量圈数,只执行圈数为0的任务。

时间轮插入的时间复杂度为O(1),获取任务列表复杂度为O(1),执行列表最差为O(n)。对比最小堆,时间轮插入删除元素更快。

核心代码如下:

// 定义
type TimeWheel struct {
interval    time.Duration // 触发间隔
slots       int // 总插槽数
currentSlot int // 当前插槽数
tasks       []*list.List // 环形列表,每个元素为对应插槽的任务列表
set         containerx.Set[string] // 记录所有任务key值,用来检查任务是否被删除
tricker *time.Ticker // 定时触发器
logger logr.Logger
}
func (tw *TimeWheel) Run() error {
tw.tricker = time.NewTicker(tw.interval)
for {
// 通过定时器模拟时间轮转动
now, ok := <-tw.tricker.C
if !ok {
break
}
// 转动一次,执行任务列表
tw.RunTask(now, tw.currentSlot)
tw.currentSlot = (tw.currentSlot + 1) % tw.slots
}
return nil
}
func (tw *TimeWheel) RunTask(now time.Time, slot int) {
// 一次执行任务列表
for item := taskList.Front(); item != nil; {
task, ok := item.Value.(*TimeWheelTask)
// 任务圈数大于0,不需要执行,将圈数减一
if task.circle > 0 {
task.circle--
item = item.Next()
continue
}
// 运行任务
go task.Exec()
// 计算任务下次运行时间
next := item.Next()
taskList.Remove(item)
item = next
task.next = task.Next(now)
if !task.next.IsZero() {
tw.add(now, task)
} else {
tw.Remove(task.Name())
}
}
}
// 添加任务,计算下一次任务执行的插槽与圈数
func (tw *TimeWheel) add(now time.Time, task *TimeWheelTask) {
if !task.initialized {
task.next = task.Next(now)
task.initialized = true
}
duration := task.next.Sub(now)
if duration <= 0 {
task.slot = tw.currentSlot + 1
task.circle = 0
} else {
mult := int(duration / tw.interval)
task.slot = (tw.currentSlot + mult) % tw.slots
task.circle = mult / tw.slots
}
tw.tasks[task.slot].PushBack(task)
tw.set.Insert(task.Name())
}

时间轮的主要逻辑如下:

将任务存在对应插槽的时间
通过定时间模拟时间轮转动
每次到期后遍历当前插槽的任务列表,若任务圈数为0则执行
如果任务未结束,计算下次执行的插槽与圈数
转入步骤2,依次执行

总结

本文主要总结了定时任务的两种实现方式,最小堆与时间轮,并分析其核心实现逻辑。

对于执行分布式定时任务,可以借助延时消息队列或者直接使用Kubernetes的CronJob。

自己开发的话可以借助Etcd:

中心节点Coordinator将任务按照一定算法(Hash、轮询、或者更复杂的分配算法)将任务与工作节点Worker绑定
每个Worker添加到有绑定到自己的任务则取出放到本地javascript的Cron中
如果Worker挂掉,执行将其上任务重新绑定即可

本文所有代码见github.com/qingwave/go…