目录
- 1. 进程与线程
- 2. goroutine原理
- 3. 并发与并行
- 3.1 在1个逻辑处理器上运行Go程序
- 3.2 goroutine的停止与重新调度
- 3.3 在多个逻辑处理器上运行Go程序
通常程序会被编写为一个顺序执行并完成一个独立任务的代码。如果没有特别的需求,最好总是这样写代码,因为这种类型的程序通常很容易写,也很容易维护。不过也有一些情况下,并行执行多个任务会有更大的好处。一个例子是,Web 服务需要在各自独立的套接字(socket)上同时接收多个数据请求。每个套接字请求都是独立的,可以完全独立于其他套接字进行处理。具有并行执行多个请求的能力可以显著提高这类系统的性能。考虑到这一点,Go 语言的语法和运行时直接内置了对并发的支持。
1. 进程与线程
当运行一个应用程序的时候,操作系统会为这个应用程序启动一个进程。可以将这个进程看作一个包含了应用程序在运行中需要用到和维护的各种资源的容器。这些资源包括但不限于内存地址空间、文件和设备的句柄以及线程。
一个线程是一个执行空间,这个空间会被 操作系统调度来运行函数中所写的代码。每个进程至少包含一个线程,每个进程的初始线程被称作主线程。因为执行这个线程的空间是应用程序的本身的空间,所以当主线程终止时,应用程序也会终止。操作系统将线程调度到某个处理器上运行,这个处理器并不一定是进程所在的处理器。不同操作系统使用的线程调度算法一般都不一样,但是这种不同会被 操作系统屏蔽,并不会展示给程序员。
2. goroutine原理
Go 语言里的并发指的是能让某个函数独立于其他函数运行的能力。操作系统会在物理处理器上调度线程来运行,而Go语言中当一个函数创建为goroutine时,Go 会将其视为一个独立的工作单元,这个单元会被调度到可用的逻辑处理器上执行。每个逻辑处理器都分别绑定到单个操作系统线程。Go语言运行时默认会为每个可用的物理处理器分配一个逻辑处理器。
Go 语言运行时的调度器是一个复杂的软件,能管理被创建的所有goroutine 并为其分配执行时间。这个调度器在操作系统之上,将操作系统的线程与运行时的逻辑处理器绑定,并在逻辑处理器上运行goroutine。调度器在任何给定的时间,都会全面控制哪个goroutine 要在哪个逻辑处理器上运行。
下图中可以看到操作系统线程、逻辑处理器和本地运行队列之间的关系。如果创建一个goroutine 并准备运行,这个goroutine 就会被放到调度器的全局运行队列中。之后,调度器就将这些队列中的goroutine 分配给一个逻辑处理器,并放到这个逻辑处理器对应的本地运行队列中。本地运行队列中的goroutine 会一直等待直到自己被分配的逻辑处理器执行。
有时,正在运行的goroutine 需要执行一个阻塞的系统调用,如打开一个文件。当这类调用发生时,线程和goroutine 会从逻辑处理器上分离,该线程会继续阻塞,等待系统调用的返回。与此同时,这个逻辑处理器就失去了用来运行的线程。所以,调度器会创建一个新线程,并将其绑定到该逻辑处理器上。之后,逻辑处理器会从本地运行队列里选择另一个goroutine 来运行。一旦被阻塞的系统调用执行完成并返回,对应的goroutine 会放回到本地运行队列,而之前的线程会保存好,以便之后可以继续使用。
如果一个 goroutine 需要做一个网络I/O 调用,流程上会有些不一样。在这种情况下,goroutine会和逻辑处理器分离,并移到集成了网络轮询器的运行时。一旦该轮询器指示某个网络读或者写操作已经就绪,对应的goroutine 就会重新分配到逻辑处理器上来完成操作。调度器对可以创建的逻辑处理器的数量没有限制,但语言运行时默认限制每个程序最多创建10 000 个线程。这个限制值可以通过调用runtime/debug 包的SetMaxThreads 方法来更改。如果程序试图使用更多的线程,就会崩溃。
3. 并发与并行
并发(concurrency)不是并行(parallelism)。并行是让不同的代码片段同时在不同的物理处理器上执行。并行的关键是同时做很多事情,而并发是指同时管理很多事情,这些事情可能只做了一半就被暂停去做别的事情了。在很多情况下,并发的效果比并行好,因为操作系统和硬件的总资源一般很少,但能支持系统同时做很多事情。这种“使用较少的资源做更多的事情”的哲学,也是指导Go 语言设计的哲学。
如果希望让goroutine 并行,必须使用多于一个逻辑处理器。当有多个逻辑处理器时,调度器会将goroutine 平等分配到每个逻辑处理器上。这会让goroutine 在不同的线程上运行。不过要想真的实现并行的效果,用户需要让自己的程序运行在有多个物理处理器的机器上。否则,哪怕Go 语言运行时使用多个线程,goroutine 依然会在同一个物理处理器上并发运行,达不到并行的效果。
下图展示了在一个逻辑处理器上并发运行goroutine 和在两个逻辑处理器上并行运行两个并发的goroutine 之间的区别。调度器包含一些聪明的算法,这些算法会随着Go 语言的发布被更新和改进,所以不推荐盲目修改语言运行时对逻辑处理器的默认设置。如果真的认为修改逻辑处理器的数量可以改进性能,也可以对语言运行时的参数进行细微调整。
3.1 在1个逻辑处理器上运行Go程序
下面的代码通过调用runtime 包的GOMAXPROCS 函数,更改调度器只可以使用1个逻辑处理器。创建两个goroutine,以并发的形式分别显示大写和小写的英文字母:
package main import ( "fmt" "runtime" "sync" ) func main() { runtime.GOMAXPROCS(1) // 分配一个逻辑处理器给调度器使用 var wg sync.WaitGroup wg.Add(2) fmt.Println("Start Goroutines") go func() { defer wg.Done() for count := 0; count < 3; count++ { for char := 'a'; char < 'a'+26; char++ { fmt.Printf("%c ", char) } } }() go func() { defer wg.Done() for count := 0; count < 3; count++ { for char := 'A'; char < 'A'+26; char++ { fmt.Printf("%c ", char) } } }() fmt.Println("Waiting To Finish") wg.Wait() fmt.Println("\nTerminating Program") }
程序的输出为:
Start Goroutines
Waiting To Finish
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z A B C D E F G H I J K L M N O P Q R S T U V W X Y Z A B C
D E F G H I J K L M N O P Q R S T U V W X Y Z a b c d e f g h i j k l m n o p q r s t u v w x y z a b c d e f g h i j k l m n
o p q r s t u v w x y z a b c d e f g h i j k l m n o p q r s t u v w x y z
Terminating Program
使用1个逻辑处理器,在同一个时刻实际只有一个线程在运行,而且每个goroutine花费的时间太短,并没有发生goroutine的停止与重新调度,所以通过程序输出可以看出每个goroutine在一个逻辑处理器上并发运行的效果,他们看起来是顺序执行的。
3.2 goroutine的停止与重新调度
基于调度器的内部算法,一个正运行的goroutine 在工作结束前,可以被停止并重新调度。调度器这样做的目的是防止某个goroutine 长时间占用逻辑处理器。当goroutine 占用时间过长时,调度器会停止当前正运行的goroutine,并给其他可运行的goroutine 运行的机会。
下图从逻辑处理器的角度展示了这一场景。在第1 步,调度器开始运行goroutine A,而goroutine B 在运行队列里等待调度。之后,在第2 步,调度器交换了goroutine A 和goroutine B。由于goroutine A 并没有完成工作,因此被放回到运行队列。之后,在第3 步,goroutine B 完成了它的工作并被系统销毁。这也让goroutine A 继续之前的工作。
下面的代码中,同样设置只使用1个逻辑处理器,程序创建了两个goroutine,分别打印1~5000 内的素数。查找并显示素数会消耗不少时间,这会让调度器有机会在第一个goroutine 找到所有素数之前,切换该goroutine的时间片:
package main import ( "fmt" "runtime" "sync" ) var wg sync.WaitGroup func main() { runtime.GOMAXPROCS(1) // 分配一个逻辑处理器给调度器使用 wg.Add(2) // 创建两个goroutine fmt.Println("Create Goroutines") go printPrime("A") go printPrime("B") fmt.Println("Waiting To Finish") wg.Wait() fmt.Println("Terminating Program") } // 显示 5000 以内的素数值 func printPrime(prefix string) { defer wg.Done() next: for outer := 2; outer < 5000; outer++ { for inner := 2; inner < outer; inner++ { if outer%inner == 0 { continue next } } fmt.Printf("%s:%d\n", prefix, outer) } fmt.Println("Completed", prefix) }
程序的输出为:
Create Goroutines
Waiting To Finish
B:2
B:3
...
B:4583
B:4591
A:3 ** 切换 goroutine
A:5
...
A:4561
A:4567
B:4603 ** 切换 goroutine
B:4621
...
Completed B
A:4457 ** 切换 goroutine
A:4463
...
A:4993
A:4999
Completed A
Terminating Program
goroutine B 先显示素数。goroutine B 打印到素数4591后,调度器就将正运行的goroutine切换为goroutine A。之后goroutine A 在线程上执行了一段时间,再次切换为goroutine B。这次goroutine B 完成了所有的工作。一旦goroutine B 返回,就会看到线程再次切换到goroutine A 并完成所有的工作。每次运行这个程序,调度器切换的时间点都会稍微有些不同。
3.3 在多个逻辑处理器上运行Go程序
如果给调度器分配多个逻辑处理器,我们会看到之前的示例程序的输出行为会有些不同。下面的代码中把逻辑处理器的数量改为2,让我们看看打印英文字母的效果:
package main import ( "fmt" "runtime" "sync" ) func main() { runtime.GOMAXPROCS(2) // 分配2个逻辑处理器给调度器使用 var wg sync.WaitGroup wg.Add(2) fmt.Println("Start Goroutines") go func() { defer wg.Done() // 显示小写字母表3 次 for count := 0; count < 3; count++ { for char := 'a'; char < 'a'+26; char++ { fmt.Printf("%c ", char) } } }() go func() { defer wg.Done() // 显示大写字母表3 次 for count := 0; count < 3; count++ { for char := 'A'; char < 'A'+26; char++ { fmt.Printf("%c ", char) } } }() fmt.Println("Waiting To Finish") wg.Wait() fmt.Println("\nTerminating Program") }
程序输出为:
Start Goroutines
Waiting To Finish
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z A B C D E F G H I J K L M N O P Q R S a b c d e f g h i j k l m
n o p q r s t u v w x y z a b c d e f g h i j k l m n o p q r s t u v w x y z a b c d e f g h i j k l m n o p q r s t u v w x y z T U
V W X Y Z A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
Terminating Program
两个goroutine 几乎是同时开始运行的,大小写字母是混合在一起显示的。所以每个goroutine 独自运行在自己的线程上。