golang 限制同一时间的并发量操作

go的并发量是很厉害的，goroutine创建的代价极小，其中一个重要的原因是因为go采用了分段栈技术，每一个goroutine只占极小的空间。与此同时，goroutine是语言层面的，减少了内核态到用户态的切换开销，并且goroutine摒弃了一些golang用不到的一些os thread的系统调用，创建代价小。

我们可以一瞬间创建很多个goroutine，这是相当容易的。

乍一看，这与题目完全不符，前面说了那么多，难道不是鼓励我们多创建goroutine吗？不不不，goroutine确实很好用，但是如果不加以限制，很有可能出现其他的不可预料的错误。

比如在web领域中，一个连接，在linux/unix下就相当于是打开了一个文件，占用一个文件描述符。但是系统会规定文件描述符的上限，我们可以使用ulimit -n来进行查看，如果我们遵循量大就好的话，那么一拥而上的请求连接会瞬间报错。

2018/06/30 10:09:54 dial tcp :8080: socket: too many open files

上面这条报错信息源于我写的一个循环请求的工具

package main
import (
  "sync"
  "net"
  "strconv"
  "fmt"
  "log"
)
const (
  MAX_CONCURRENCY = 10000 
)
var waitGroup sync.WaitGroup
func main(){
  concurrency()
  waitGroup.Wait()
}
//进行网络io
func request(currentCount int){
  fmt.Println("request" + strconv.Itoa(currentCount) + "\r")
  conn, err := net.Dial("tcp",":8080")
  if err != nil { log.Fatal(err) }
  defer conn.Close()
  defer waitGroup.Done()
}
//并发请求
func concurrency(){
  for i := 0;i < MAX_CONCURRENCY;i++ {
    waitGroup.Add(1)
    go request(i)
  }
}

用go建立一个服务端很简单，我这里简单的贴下server的代码

package main
import (
  "io"
  "os"
  "fmt"
  "net"
)
func checkErr(err error){
  if err != nil { fmt.Fprintln(os.Stderr, err) }
}
func main() {
  listener, err := net.Listen("tcp",":8080")
  checkErr(err)
  for {
    conn, err := listener.Accept()
    checkErr(err)
    go func(conn net.Conn){ 
      _, err := io.WriteString(conn, "welcome!") 
      checkErr(err)
      defer conn.Close()
    }(conn)
  }
}

现在回到主题，我们可以看到一拥而上其实也有坏处，想要解决这一问题，我们可以限制同一时间的并发数量，可以利用channel来达到这一点，这有点类似于信号量（Semaphore）

创建一个带缓存的channel，其中CHANNEL_CACHE为同一时间的最大并发量

想简单的说一下为什么这里chan的类型要用一个空的struct，这是因为在这个场景下（限制同一时间的并发量），通过channel传输的数据的类型并不重要，我们只需要通过做一个通知效果就行了（就像你通知你朋友起床，你只用闪个电话，而不用实际的接通，省去了电话费的开销），这里的空的struct实际上是不占任何空间的，因此这里选用空的struct

const (
  CHANNEL_CACHE = 200
)
var tmpChannel = make(chan struct{}, CHANNEL_CACHE)

在与服务器建立连接的地方这样写（是不是很类似于信号量）

tmpChan <- struct{}{}
conn, err := net.Dial("tcp",":8080")
<- tmpChan

这样同一时间的并发量就由CHANNEL_CACHE限制下来

经过循环开启的goroutine在请求服务器之前会向channel发送消息，如果缓存满了，那么说明已经有CHANNEL_CACHE个goroutine在进行与服务器的连接，接着就会阻塞在这里，等待其中一个goroutine处理完之后，从channel中读出一个空的struct，这时阻塞的地方向channel发送一个空struct，就可以与服务器建立连接了

下面贴一下全部的代码

package main
import (
  "sync"
  "net"
  "strconv"
  "fmt"
  "log"
)
const (
  MAX_CONCURRENCY = 10000 
  CHANNEL_CACHE = 200
)
var tmpChan = make(chan struct{}, MAX_CONCURRENCY)
var waitGroup sync.WaitGroup
func main(){
  concurrency()
  waitGroup.Wait()
}
//进行网络io
func request(currentCount int){
  fmt.Println("request" + strconv.Itoa(currentCount) + "\r")
  tmpChan <- struct{}{}
  conn, err := net.Dial("tcp",":8080")
  <- tmpChan
  if err != nil { log.Fatal(err) }
  defer conn.Close()
  defer waitGroup.Done()
}
//并发
func concurrency(){
  for i := 0;i < MAX_CONCURRENCY;i++ {
    waitGroup.Add(1)
    go request(i)
	}
}

这样就可以愉快的进行并发了！！！

补充：Golang限制N个并发同时运行

我就废话不多说了，大家还是直接看代码吧~

package main 
import (
  "fmt"
  "sync"
  "time"
) 
var wg sync.WaitGroup 
func main() {
  var wg sync.WaitGroup
 
  sem := make(chan struct{}, 2) // 最多允许2个并发同时执行
  taskNum := 10
 
  for i := 0; i < taskNum; i++ {
    wg.Add(1)
 
    go func(id int) {
      defer wg.Done()
 
      sem <- struct{}{}    // 获取信号
      defer func() { <-sem }() // 释放信号
 
      // do something for task
      time.Sleep(time.Second * 2)
      fmt.Println(id, time.Now())
    }(i)
  }
  wg.Wait()
}