简介

channel 是 Go 语言中的一个核心类型,可以把它看成管道。并发核心单元通过它就可以发送或者接收数据进行通讯,这在一定程度上又进一步降低了编程的难度。

channel 是一个数据类型,主要用来解决 go 程的同步问题以及 go 程之间数据共享(数据传递)的问题。

goroutine 运行在相同的地址空间,因此访问共享内存必须做好同步。goroutine 奉行通过通信来共享内存,而不是共享内存来通信。

引⽤类型 channel 可用于多个 goroutine 通讯。其内部实现了同步,确保并发安全(通过 CSP)。

channel

强调一下:

channel 是一个数据类型,对应一个“管道(通道)”。

定义 channel 变量

make

既然是引用, 那么我们在传参的时候就能完成在 A 函数栈帧内修改 B 函数栈帧数据的目的. 说白了就是传的地址.

当我们复制一个 channel 或用于函数参数传递时,我们只是拷贝了一个 channel 引用,因此调用者和被调用者将引用同一个 channel 对象。 和其它的引用类型一样,channel 的零值也是 nil。

make()
  • chan 是创建 channel 所需使用的关键字。
  • Type 代表指定 channel 收发数据的类型。
capacity = 0capacity > 0
<-

默认情况下,channel 接收和发送数据都是阻塞的,除非另一端已经准备好,这样就使得 goroutine 同步变的更加的简单,而不需要显式的 lock

我们先看一下没有用 channel 的例子:

结果:

那么,怎么用 channel 实现来保证顺序输出呢?

因为,person1 与 person2 都需要用一个 channel,所以要在全局定义一个 channel。具体代码如下:

PS:你要传的什么类型数据与 channel 中定义的类型没有必然的联系。

person2<-chperson1ch <- 777
ch <- 777<-ch

我们再来看一段代码:

运行结果:

以上我们都是用 channel 用来做数据同步,并没有用到 channel 中的数据,下面我们看一个用 channel 完成数据传递的例子:

注意:len(ch): channel 中剩余未读取的数据个数; cap(ch): channel 的容量

运行结果:

强调一下:

channel 有两个端:

  • 写端(传入端):chan <- 777
  • 读端(传出端):<- chan

要求:读端和写端必须同时满足条件(读端有数据可读,写端有数据可写),才能在 channel 中完成数据流动。否则,阻塞。

【补充知识点】

每当有一个进程启动时,系统会自动打开三个文件:标准输入、标准输出、标准错误,对应三个文件:stdin、stdout、stderr。

当进程运行结束时,系统会自动关闭这三个文件。

无缓冲的channel - 同步通信

无缓冲的通道(unbuffered channel)是指在接收前没有能力保存任何值的通道。

这种类型的通道要求发送 goroutine 和接收 goroutine 同时准备好,才能完成发送和接收操作。否则,通道会导致先执行发送或接收操作的 goroutine 阻塞等待。

这种对通道进行发送和接收的交互行为本身就是同步的。其中任意一个操作都无法离开另一个操作单独存在。

阻塞:由于某种原因数据没有到达,当前协程(线程)持续处于等待状态,直到条件满足,才接触阻塞。

同步:在两个或多个协程(线程)间,保持数据内容一致性的机制。

下图展示两个 goroutine 如何利用无缓冲的通道来共享一个值:

使用无缓冲channel在goroutine之间同步

简单说明:

  • 在第 1 步,两个 goroutine 都到达通道,但哪个都没有开始执行发送或者接收。
  • 在第 2 步,左侧的 goroutine 将它的手伸进了通道,这模拟了向通道发送数据的行为。这时,这个 goroutine 会在通道中被锁住,直到交换完成。
  • 在第 3 步,右侧的 goroutine 将它的手放入通道,这模拟了从通道里接收数据。这个 goroutine 一样也会在通道中被锁住,直到交换完成。
  • 在第 4 步和第 5 步,进行交换,并最终,在第 6 步,两个 goroutine 都将它们的手从通道里拿出来,这模拟了被锁住的 goroutine 得到释放。两个 goroutine 现在都可以去做别的事情了。

无缓冲的 channel 创建格式:

如果没有指定缓冲区容量,那么该通道就是同步的,因此会阻塞到发送者准备好发送和接收者准备好接收。

例如:

运行结果:

强调一下:

无缓冲 channel 的容量为0。

channel 至少应用于两个 go 程中:一个读、另一个写。

具备同步能力。读、写同步。(比如 打电话)

有缓冲的channel - 异步通信

有缓冲的通道(buffered channel)是一种在被接收前能存储一个或者多个数据值的通道。

这种类型的通道并不强制要求 goroutine 之间必须同时完成发送和接收。通道会阻塞发送和接收动作的条件也不同。

只有通道中没有要接收的值时,接收动作才会阻塞。

只有通道没有可用缓冲区容纳被发送的值时,发送动作才会阻塞。

这导致有缓冲的通道和无缓冲的通道之间的一个很大的不同:无缓冲的通道保证进行发送和接收的 goroutine 会在同一时间进行数据交换;有缓冲的通道没有这种保证。

使用有缓冲channel在goroutine之间同步的示例图:

使用有缓冲channel在goroutine之间同步

  • 在第 1 步,右侧的 goroutine 正在从通道接收一个值。
  • 在第 2 步,右侧的这个 goroutine 独立完成了接收值的动作,而左侧的 goroutine 正在发送一个新值到通道里。
  • 在第 3 步,左侧的 goroutine 还在向通道发送新值,而右侧的 goroutine 正在从通道接收另外一个值。这个步骤里的两个操作既不是同步的,也不会互相阻塞。
  • 最后,在第 4 步,所有的发送和接收都完成,而通道里还有几个值,也有一些空间可以存更多的值。

有缓冲的 channel 创建格式:

如果给定了一个缓冲区容量,通道就是异步的。只要缓冲区有未使用空间用于发送数据,或还包含可以接收的数据,那么其通信就会无阻塞地进行。

请看以下代码:

运行结果:

强调一下:

有缓冲 channel 的容量大于 0。

channel 应用于两个 go 程中:一个读、另一个写。

缓冲区可以进行数据存储,存储至容量上限才阻塞。

具备异步的能力,不需要同时操作 channel 缓冲区。(比如发短信)

关闭channel

如果发送者知道,没有更多的值需要发送到 channel 的话,那么让接收者也能及时知道没有多余的值可接收将是有用的,因为接收者可以停止不必要的接收等待。

close

对端可以判断 channel 是否关闭:

例如:

运行结果:

for range

运行结果:

强调一下:

for num := range ch{}  // 注意形式,不是 <-ch

单向 channel 及应用

默认情况下,通道 channel 是双向的,也就是,既可以往里面发送数据也可以同里面接收数据。

但是,我们经常见一个通道作为参数进行传递而只希望对方是单向使用的,要么只让它发送数据,要么只让它接收数据,这时候我们可以指定通道的方向。

image

单向 channel 变量的声明非常简单,如下:

chan<-<-chan

可以将 channel 隐式转换为单向队列,只收或只发,不能将单向 channel 转换为双向 channel:

来看一下单向 channel 的简单示例(记住了,channel 是传引用):

运行结果:

生产者消费模型

生产者消费者模型分析

单向 channel 最典型的应用是: 生产者消费者模型.

所谓生产者消费者模型: 某个模块(函数等)负责产生数据, 这些数据由另一个模块来负责处理(此处的模块是广义的, 可以是类, 函数, 协程, 线程, 进程等). 产生数据的模块, 就形象地称为生产者; 而处理数据的模块, 就称为消费者.

单单抽象出生产者和消费者, 还够不上是生产者消费者模型. 该模式还需要有一个缓冲区处于生产者和消费者之间, 作为一个中介. 生产者把数据放入缓冲区, 而消费者从缓冲区取出数据. 如下图所示

生产者消费者模型

可以这样理解, 假设你要寄一封信, 大致过程如下:

  1. 把信写好 -- 相当于生产者制造数据
  2. 把信放入邮筒 -- 相当于生产者把数据放入缓冲区
  3. 邮递员把信从邮筒取出 -- 相当于消费者把数据取出缓冲区
  4. 邮递员把信拿去邮局做相应的处理 -- 相当于消费者处理数据

那么, 这个缓冲区有什么用呢? 为什么不让生产者直接调用消费者的某个函数, 直接把数据传递过去, 而去设置一个缓冲区呢?

缓冲区的好处大概如下:

1: 解耦 ( 降低 生产者 和 消费者 之间的耦合度 )

假设生产者和消费者分别是两个类. 如果让生产者直接调用消费者的某个方法, 那么生产者对于消费者就会产生依赖(也就是耦合). 将来如果消费者的代码发生变化, 可能会直接影响到生产者. 而如果两者都依赖某个缓冲区, 两者之间不直接依赖, 耦合度也就相应降低了.

依然用寄信的例子简单说一下, 假设生产者就是你, 你负责写信, 如果没有邮筒(即缓冲区), 你就需要直接把信给邮递员(消费者). 但是, 过了几个月, 邮递员换人了, 你想要寄信就必须再认识新的邮递员, 你刚和新的邮递员熟悉之后, 又换了一个邮递员, 你又要重新认识... 这就显得很麻烦, 就是想寄个信而已, 不想认识那么多邮递员...

但是如果有邮筒(缓冲区)呢, 无论邮递员怎么更换, 这个与你无关, 我依然是把信放入邮筒就可以了. 这样一来, 就简单多了.

2: 提高并发能力 ( 生产者与消费者数量不对等时, 能保持正常通信 )

生产者直接调用消费者的某个方法, 还有另一个弊端

由于函数调用是同步的(或者叫阻塞的), 在消费者的方法没有返回之前, 生产者只好一直等在那边. 万一消费者处理数据很慢, 生产者只能白白浪费时间.

使用了生产者/消费者模式之后, 生产者和消费者可以是两个独立的并发主体.

生产者把制造出来的数据放入缓冲区, 就可以再去生产下一个数据. 基本上不用依赖消费者的处理速度.

其实最初这个生产者消费者模式, 主要就是用来处理并发问题的.

从寄信的例子来看, 如果没有邮筒, 你得拿着信傻站在路口等邮递员过来收(相当于生产者阻塞); 又或者邮递员得挨家挨户问, 谁要寄信(相当于消费者轮询).

3: 缓存 ( 生产者与消费者数据处理速度不一致时, 暂存数据 )

如果生产者制造数据的速度时快时慢, 缓冲区的好处就体现出来了.

当数据制造快的时候, 消费者来不及处理, 未处理的数据可以暂时存在缓冲区中. 等生产者的制造速度慢下来, 消费者再慢慢处理掉.

再拿寄信的例子举例, 假设邮递员一次只能带走1000封信. 万一某次碰上情人节送贺卡, 需要寄出的信超过1000封, 这时候邮筒这个缓冲区就派上用场了. 邮递员把来不及带走的信暂存在邮筒中, 等下次过来时再拿走.

生产者消费者模型实现

先来看一下无缓冲的例子

运行结果:

再来看一下有缓冲的例子 两者对比结果

运行结果:

简单说明

首先创建一个双向的 channel, 然后开启一个新的 goroutine, 把双向通道作为参数传递到 producer 方法中, 同时转成只写通道. 子 go 程开始执行循环, 向只写通道中添加数据, 这就是生产者.

主 go 程直接调用 consumer 方法, 该方法将双向通道转成只读通道, 通过循环每次从通道中读取数据, 这就是消费者.

注意, channel 作为参数传递, 是引用传递.

生产者消费者 - 模拟订单

在实际的开发中, 生产者消费者模式应用也非常的广泛.

例如, 在电商网站中, 订单处理, 就是非常典型的生产者消费者模式.

当很多用户单击下订单按钮后, 订单生产的数据全部放到缓冲区(队列)中, 然后消费者将队列中的数据取出来发送至仓库管理等系统.

通过生产者消费者模式, 将订单系统与仓库管理系统隔离开, 且用户可以随时下单(生产数据). 如果订单系统直接调用仓库系统, 那么用户单击下订单按钮后, 要等到仓库系统的结果返回, 这样速度很慢.

接下来我们就来模拟一下订单处理的过程.

OrderInfo

定时器

time.Timer

Timer 是一个定时器. 代表未来的一个单一事件, 你可以告诉 Timer 你要等待多长时间.

Timer.CTimer.C

定时器的启动

示例代码:

3 种定时方法

定时器的停止

死循环只是为了方便查看结果.

定时器的重置

  • 创建定时器: myTimer := time.NewTimer(time.Second * 2)
  • 停止定时器: myTimer.Stop() [此时 <- myTimer.C 会阻塞]
  • 重置定时器: myTimer.Reset(time.Second * 2)

周期定时器 Time.Ticker

Ticker是一个周期触发定时的计时器, 它会按照一个时间间隔往channel发送系统当前时间, 而channel的接受者可以以固定的时间间隔从channel中读取.

李培冠博客

欢迎访问我的个人网站:

李培冠博客:lpgit.com