前言

在数据结构中,队列遵循着FIFO(先进先出)的规则。在此基础上,人们引申出了“优先级队列”的概念。

优先级队列,是带有优先级属性的队列,所有的队列元素按照优先级进行排序,消费者会先对优先级高的队列元素进行处理。

优先级队列的使用场景也是非常多的。比如,作业调度系统,当一个作业完成后,需要从剩下的作业中取出优先级最高的作业进行处理。又比如,一个商城的用户分为普通用户和vip用户,vip用户更容易抢到那些秒杀商品。

在本文中,我将和大家一起探讨,golang优先级队列的一种实现方案。

你可以收获
  • golang切片特性
  • golang map特性
  • golang并发场景下的解决方案
  • golang优先级队列的实现思路
正文

内容脉络

为了让大家脑海里有个大致的轮廓,我先把正文的大纲展示出来。

image.png

基础知识

在正式开始“优先级队列”这个话题之前,我们首先要明确以下的一些golang特性。

  • 切片的特性

    • 元素的有序性
    • 非线程安全
  • map的特性

    • 元素的无序性
    • 非线程安全
  • 并发场景下的解决方案

    • 互斥锁:可以对非线程安全的数据结构创建临界区,一般用于同步场景;
    • 管道:可以对非线程安全的数据结构进行异步处理

实现思路

既然,我们了解了golang的一些特性,那么,我们接下来就要明确,如何去实现优先级队列了。

我们都知道,无论是哪一种队列,必然是存在生产者和消费者两个部分,对于优先级队列来说,更是如此。因此,咱们的实现思路,也将从这两个部分来谈。

1、生产者

对于生产者来说,他只需要推送一个任务及其优先级过来,咱们就得根据优先级处理他的任务。

由于,我们不大好判断,到底会有多少种不同的优先级传过来,也无法确定,每种优先级下有多少个任务要处理,所以,我们可以考虑使用map来存储优先级队列。其中key为优先级,value为属于该优先级下的任务队列(即管道)

image.png
2、消费者

对于消费者来说,他需要获取优先级最高的任务进行消费。

但是,如果只按照上面所说的map来存储优先级队列的话,我们是没法找到优先级最高的任务队列的,因为map的元素是无序的。那么,我们怎么处理这个问题呢?

我们都知道,在golang的数据结构里,切片的元素是具有有序性的。那么,我们只需要将所有的优先级按从小到大的方式,存储在一个切片里,就可以了。等到消费的时候,我们可以先从切片中,取出最大的优先级,然后再根据这个key去优先级队列的map中查询,是不是就可以了?

image.png

目标规划

想好了实现思路之后,我们就得对接下来的代码实现做一个规划了。

  • 数据结构

    • 存储优先级队列的map
    • 存储优先级的切片
    • 互斥锁
    • 其他…
  • 生产者

    • 添加任务到优先级队列
  • 消费者

    • 从优先级队列获取任务

步步为营

1、数据流

(1)调用NewPriorityQueue() ,初始化优先级队列对象。

(2)初始化优先级队列map。

(3)开启协程,监听一个接收推送任务的全局管道pushChan

(4)用户调用Push() ,推送的任务进入pushChan

(5)推送的任务被加到优先级队列中。

(6)消费者从优先级队列中获取优先级最高的一个任务。

(7)消费者执行任务。

image.png

2、数据结构

(1)优先级队列对象

type PriorityQueue struct {
   mLock      sync.Mutex         // 互斥锁,queues和priorities并发操作时使用
   queues     map[int]chan *task // 优先级队列map
   pushChan   chan *task         // 推送任务管道
   priorities []int              // 记录优先级的切片(优先级从小到大排列)
}

(2)任务对象

type task struct {
   priority int    // 任务的优先级
   f        func() // 任务的执行函数
}

3、初始化优先级队列对象

func NewPriorityQueue() *PriorityQueue {
   pq := &PriorityQueue{
      queues:   make(map[int]chan *task), // 初始化优先级队列map
      pushChan: make(chan *task, 100),
   }

   return pq
}

当然,在这个过程中,我们需要对pushChan进行监听。如果有任务推送过来,咱们得处理。

func (pq *PriorityQueue) listenPushChan() {
   for {
      select {
      case taskEle := <-pq.pushChan:
         // TODO 这里接收到推送的任务,并且准备处理
      }
   }
}

将这个监听函数放到NewPriorityQueue()中:

func NewPriorityQueue() *PriorityQueue {
   pq := &PriorityQueue{
      queues:   make(map[int]chan *task),
      pushChan: make(chan *task, 100),
   }

   // 监听pushChan
   go pq.listenPushChan()
   return pq
}

4、生产者推送任务

生产者推送任务的时候,我们只需要将任务放到pushChan中:

func (pq *PriorityQueue) Push(f func(), priority int) {
   pq.pushChan <- &task{
      f:        f,
      priority: priority,
   }
}

5、将推送任务加到优先级队列中

这一步就比较关键了。我们前面谈到,优先级队列最核心的数据结构有两个:优先级队列map和优先级切片。因此,推送任务添加到优先级队列的操作,咱们得分两种情况来看:

(1)之前已经推过相同优先级的任务

这种情况非常简单,咱们其实只要操作优先级队列map就可以了。

func (pq *PriorityQueue) listenPushChan() {
   for {
      select {
      case taskEle := <-pq.pushChan:
         priority := taskEle.priority
         pq.mLock.Lock()
         if v, ok := pq.queues[priority]; ok {
            pq.mLock.Unlock()
            // 之前推送过相同优先级的任务
            // 将推送的任务塞到对应优先级的队列中
            v <- taskEle
            continue
         }

         // todo 之前未推过相同优先级任务的处理...
      }
   }
}

(2)之前未推过相同优先级的任务

这种情况会稍微复杂一些。我们不仅要将新的优先级插入到优先级切片正确的位置,而且要将任务添加到对应优先级的队列。

1)将新的优先级插入到优先级切片中

a. 首先,咱们得寻找新优先级在切片中的插入位置。这里,咱们用了二分法。

// 通过二分法寻找新优先级的切片插入位置
func (pq *PriorityQueue) getNewPriorityInsertIndex(priority int, leftIndex, rightIndex int) (index int) {
   if len(pq.priorities) == 0 {
      // 如果当前优先级切片没有元素,则插入的index就是0
      return 0
   }

   length := rightIndex - leftIndex
   if pq.priorities[leftIndex] >= priority {
      // 如果当前切片中最小的元素都超过了插入的优先级,则插入位置应该是最左边
      return leftIndex
   }

   if pq.priorities[rightIndex] <= priority {
      // 如果当前切片中最大的元素都没超过插入的优先级,则插入位置应该是最右边
      return rightIndex + 1
   }

   if length == 1 && pq.priorities[leftIndex] < priority && pq.priorities[rightIndex] >= priority {
      // 如果插入的优先级刚好在仅有的两个优先级之间,则中间的位置就是插入位置
      return leftIndex + 1
   }

   middleVal := pq.priorities[leftIndex+length/2]

   // 这里用二分法递归的方式,一直寻找正确的插入位置
   if priority <= middleVal {
      return pq.getNewPriorityInsertIndex(priority, leftIndex, leftIndex+length/2)
   } else {
      return pq.getNewPriorityInsertIndex(priority, leftIndex+length/2, rightIndex)
   }
}

b. 找到插入位置之后,我们才要插入。在这个过程中,插入位置右侧的元素全部都要向右边移动一位。

// index右侧元素均需要向后移动一个单位
func (pq *PriorityQueue) moveNextPriorities(index, priority int) {
   pq.priorities = append(pq.priorities, 0)
   copy(pq.priorities[index+1:], pq.priorities[index:])

   pq.priorities[index] = priority
}

这样,我们就成功地将新的优先级插入了切片。

2)将推送任务放入优先级队列map也就顺理成章。

// 创建一个新优先级管道
pq.queues[priority] = make(chan *task, 10000)

// 将任务塞到新的优先级管道中
pq.queues[priority] <- taskEle

因此,listenPushChan()的代码如下:

func (pq *PriorityQueue) listenPushChan() {
   for {
      select {
      case taskEle := <-pq.pushChan:
         priority := taskEle.priority
         pq.mLock.Lock()
         if v, ok := pq.queues[priority]; ok {
            pq.mLock.Unlock()
            // 将推送的任务塞到对应优先级的队列中
            v <- taskEle
            continue
         }

         // 如果这是一个新的优先级,则需要插入优先级切片,并且新建一个优先级的queue
         // 通过二分法寻找新优先级的切片插入位置
         index := pq.getNewPriorityInsertIndex(priority, 0, len(pq.priorities)-1)

         // index右侧元素均需要向后移动一个单位
         pq.moveNextPriorities(index, priority)

         // 创建一个新优先级队列
         pq.queues[priority] = make(chan *task, 10000)

         // 将任务塞到新的优先级队列中
         pq.queues[priority] <- taskEle
         pq.mLock.Unlock()
      }
   }
}

完成了生产者部分之后,接下来我们看看消费者。

6、消费者消费队列

这里分成两个步骤,首先咱们得拿到最高优先级队列的任务,然后再去执行任务。代码如下:

// 消费者轮询获取最高优先级的任务
func (pq *PriorityQueue) Consume() {
   for {
      task := pq.Pop()
      if task == nil {
         // 未获取到任务,则继续轮询
         continue
      }

      // 获取到了任务,就执行任务
      task.f()
   }
}

// 取出最高优先级队列中的一个任务
func (pq *PriorityQueue) Pop() *task {
   pq.mLock.Lock()
   defer pq.mLock.Unlock()

   for i := len(pq.priorities) - 1; i >= 0; i-- {
      if len(pq.queues[pq.priorities[i]]) == 0 {
         // 如果当前优先级的队列没有任务,则看低一级优先级的队列中有没有任务
         continue
      }

      // 如果当前优先级的队列里有任务,则取出一个任务。
      return <-pq.queues[pq.priorities[i]]
   }

   // 如果所有队列都没有任务,则返回null
   return nil
}

7、完整代码

这样,咱们的优先级队列就实现了。下面,我们将完整代码展示。

pq.go

package priority_queue

import (
   "sync"
)

type PriorityQueue struct {
   mLock      sync.Mutex         // 互斥锁,queues和priorities并发操作时使用
   queues     map[int]chan *task // 优先级队列map
   pushChan   chan *task         // 推送任务管道
   priorities []int              // 记录优先级的切片(优先级从小到大排列)
}

type task struct {
   priority int    // 任务的优先级
   f        func() // 任务的执行函数
}

func NewPriorityQueue() *PriorityQueue {
   pq := &PriorityQueue{
      queues:   make(map[int]chan *task),
      pushChan: make(chan *task, 100),
   }

   go pq.listenPushChan()
   return pq
}

func (pq *PriorityQueue) listenPushChan() {
   for {
      select {
      case taskEle := <-pq.pushChan:
         priority := taskEle.priority
         pq.mLock.Lock()
         if v, ok := pq.queues[priority]; ok {
            pq.mLock.Unlock()
            // 将推送的任务塞到对应优先级的队列中
            v <- taskEle
            continue
         }

         // 如果这是一个新的优先级,则需要插入优先级切片,并且新建一个优先级的queue
         // 通过二分法寻找新优先级的切片插入位置
         index := pq.getNewPriorityInsertIndex(priority, 0, len(pq.priorities)-1)

         // index右侧元素均需要向后移动一个单位
         pq.moveNextPriorities(index, priority)

         // 创建一个新优先级队列
         pq.queues[priority] = make(chan *task, 10000)

         // 将任务塞到新的优先级队列中
         pq.queues[priority] <- taskEle
         pq.mLock.Unlock()
      }
   }
}

// 插入work
func (pq *PriorityQueue) Push(f func(), priority int) {
   pq.pushChan <- &task{
      f:        f,
      priority: priority,
   }
}

// index右侧元素均需要向后移动一个单位
func (pq *PriorityQueue) moveNextPriorities(index, priority int) {
   pq.priorities = append(pq.priorities, 0)
   copy(pq.priorities[index+1:], pq.priorities[index:])

   pq.priorities[index] = priority
}

// 通过二分法寻找新优先级的切片插入位置
func (pq *PriorityQueue) getNewPriorityInsertIndex(priority int, leftIndex, rightIndex int) (index int) {
   if len(pq.priorities) == 0 {
      // 如果当前优先级切片没有元素,则插入的index就是0
      return 0
   }

   length := rightIndex - leftIndex
   if pq.priorities[leftIndex] >= priority {
      // 如果当前切片中最小的元素都超过了插入的优先级,则插入位置应该是最左边
      return leftIndex
   }

   if pq.priorities[rightIndex] <= priority {
      // 如果当前切片中最大的元素都没超过插入的优先级,则插入位置应该是最右边
      return rightIndex + 1
   }

   if length == 1 && pq.priorities[leftIndex] < priority && pq.priorities[rightIndex] >= priority {
      // 如果插入的优先级刚好在仅有的两个优先级之间,则中间的位置就是插入位置
      return leftIndex + 1
   }

   middleVal := pq.priorities[leftIndex+length/2]

   // 这里用二分法递归的方式,一直寻找正确的插入位置
   if priority <= middleVal {
      return pq.getNewPriorityInsertIndex(priority, leftIndex, leftIndex+length/2)
   } else {
      return pq.getNewPriorityInsertIndex(priority, leftIndex+length/2, rightIndex)
   }
}

// 取出最高优先级队列中的一个任务
func (pq *PriorityQueue) Pop() *task {
   pq.mLock.Lock()
   defer pq.mLock.Unlock()

   for i := len(pq.priorities) - 1; i >= 0; i-- {
      if len(pq.queues[pq.priorities[i]]) == 0 {
         // 如果当前优先级的队列没有任务,则看低一级优先级的队列中有没有任务
         continue
      }

      // 如果当前优先级的队列里有任务,则取出一个任务。
      return <-pq.queues[pq.priorities[i]]
   }

   // 如果所有队列都没有任务,则返回null
   return nil
}

// 消费者轮询获取最高优先级的任务
func (pq *PriorityQueue) Consume() {
   for {
      task := pq.Pop()
      if task == nil {
         // 未获取到任务,则继续轮询
         continue
      }

      // 获取到了任务,就执行任务
      task.f()
   }
}

测试代码pq_test.go

package priority_queue

import (
   "fmt"
   "math/rand"
   "testing"
   "time"
)

func TestQueue(t *testing.T) {
   defer func() {
      if err := recover(); err != nil {
         fmt.Println(err)
      }
   }()
   pq := NewPriorityQueue()
   rand.Seed(time.Now().Unix())

   // 我们在这里,随机生成一些优先级任务
   for i := 0; i < 100; i++ {
      a := rand.Intn(10)
      go func(i int) {
         pq.Push(func() {
            fmt.Println("推送任务的编号为:", i)
            fmt.Println("推送的任务优先级为:", a)
            fmt.Println("============")
         }, a)
      }(i)
   }

   // 这里会阻塞,消费者会轮询查询任务队列
   pq.Consume()
}

发散思维

上面的方案的确是实现了优先级队列,但是,有一种极端情况:如果消费者的消费速度远远小于生产者的生产速度,并且高优先级的任务被不断插入,这样,低优先级的任务就会有“饿死”的风险。

对于这种情况,我们在消费的时候,可以考虑给每一个优先级队列分配一个权重,高优先级的队列有更大的概率被消费,低优先级的概率相对较小。感兴趣的朋友们,可以自己去实现一下。

小结

本文和大家讨论了优先级队列在golang中的一种实现方案,里面应用到了切片、map、互斥锁、管道等诸多golang特性,可以说是一个非常典型的案例。其实,优先级队列在实际的业务场景中使用广泛,其实现方式也不止一种,我们需要根据实际的需求,选择最优解。