学习Golang差不多半年了,go中的并发,通道,通道同步单个来讲都不陌生,但是结合在一起运用的时候就有些懵逼,同时也不知道为何要这么做。我想这是初学者都会遇到的困惑,在这里讲下自己的理解。
为什么用通道而不是共享变量
看一段代码
func main() {
var a int
for i := 0; i < 10; i++ {
go func() {
for i := 0; i < 100; i++ {
a++
}
}()
}
time.Sleep(1 * time.Second)
fmt.Print(a)
}
// 运行结果
PS C:\Users\mayn\go\src\test_5_5> go run .\main.go
1000
复制代码
从运行结果来看,主线程是可以跟协程共享变量的,同时10个协程分别自加100次,得到1000的结果与预期结果一样
现在增加每个协程的运算量,再看一下运行结果
func main() {
var a int
for i := 0; i < 10; i++ {
go func() {
for i := 0; i < 100000; i++ {
a++
}
}()
}
time.Sleep(1 * time.Second)
fmt.Print(a)
}
// 输出结果
PS C:\Users\mayn\go\src\test_5_5> go run .\main.go
213897
PS C:\Users\mayn\go\src\test_5_5> go run .\main.go
206400
PS C:\Users\mayn\go\src\test_5_5> go run .\main.go
211926
复制代码
可以看到每个协程由100的自加变为100000的自加,此时输出结果每次都不同并且与1000000的预期结果相差很大,个人没有深入研究只是简单推测由于并发的异步特性,同一时间有多个协程执行了自增,实际cpu只计算了一次,这种误差会随着并发协程的数量和各自计算量的增多而变大。(后来有人补充cpu核数限制为1核就不会发生这种并行的情况)
使用有缓存的通道得出正确结果
func main() {
var ch = make(chan int, 10)
for i := 0; i < 10; i++ {
go func() {
var a int
for i := 0; i < 100000; i++ {
a++
}
ch <- a
}()
}
var sum int
func() {
for i := 0; i < 10; i++ {
sum += <- ch
}
}()
fmt.Print(sum)
}
// 输出结果
PS C:\Users\mayn\go\src\test_5_5> go run .\main.go
1000000
复制代码
大致思路还是开启10个协程,同时将原来定义在主线程中的变量a定义到每个协程中,在主线程中定义有10个缓冲的通道。这时每个协程各自处理自己的运算结果互不干扰,只在最后将各自运算结果写入到通道中。主线程再遍历通道进行读操作,只有当协程中有数据被写入时才能读取到数据并且汇总结果。由于读操作是在主线程中会发生阻塞,所以此时可以去掉睡眠,程序依然能正确执行,这就是通道同步。
如果通道读操作也开一个协程来处理会怎么样
func main() {
var ch = make(chan int, 10)
for i := 0; i < 10; i++ {
go func() {
var a int
for i := 0; i < 100000; i++ {
a++
}
ch <- a
}()
}
var sum int
go func() {
for i := 0; i < 10; i++ {
sum += <- ch
}
}()
fmt.Print(sum)
}
// 输出结果
PS C:\Users\mayn\go\src\test_5_5> go run .\main.go
0
复制代码
很明显如果读操作也开协程,此时主线程不会发生阻塞,主线程不等协程结束直接结束了,想要得到正确结果,主要主线程等待就行了。这样做的优点就是读操作也是并发的,不需要同步等待。
协程与主线程共享变量
还是这段代码,加上时间等待。
func main() {
var ch = make(chan int, 10)
for i := 0; i < 10; i++ {
go func() {
var a int
for i := 0; i < 100000; i++ {
a++
}
ch <- a
}()
}
var sum int
go func() {
for i := 0; i < 10; i++ {
sum += <- ch
}
}()
time.Sleep(1 * time.Second)
fmt.Print(sum)
}
// 输出结果
PS C:\Users\mayn\go\src\test_5_5> go run .\main.go
1000000
复制代码
细心观察,可以发现并发通道读操作的结果使用了主线程的变量sum,程序按预期正确执行。这就说明了协程是可以跟主线程共享变量的,只是使用的前提是这个变量只被一个协程使用,如果被多个协程使用就可能出现文章开头出现的问题。
假如主线程与协程同时操作一个变量
func main() {
var a int
go func() {
for i := 0; i < 1000000; i++ {
a++
}
}()
for i := 0; i < 1000000; i++ {
a++
}
time.Sleep(1 * time.Second)
fmt.Print(a)
}
// 输出
PS C:\Users\mayn\go\src\test_5_5> go run .\main.go
1079312
PS C:\Users\mayn\go\src\test_5_5> go run .\main.go
1003960
PS C:\Users\mayn\go\src\test_5_5> go run .\main.go
1021828
复制代码
发现即使只有单一的协程与主线程共享变量,也是会发生问题。结论:协程间尽量不要共享变量,很难保证不出问题。说这么多只是体现通道的作用与优点。
以上全部内容只是个人的一点摸索,不代表完全正确。