首先,连接池失效,问题产生背景是高频agent,agent 会发起大量的http 请求,但是,本想net/http 是支持长连接的,但是,几种情况,都产生了大量的time_wait,这里予以总结。

    第一种情况是误用transport ,为了设置代理,为每个请求,都new 了一个transport 。

client := &http.Client{

     CheckRedirect: redirectPolicyFunc,
     Timeout: time.Duration(10)*time.Second,//设置超时

}

client.Transport = &http.Transport{
     Proxy: http.ProxyURL(proxyUrl),
} //设置代理ip

    失效的原因,是client 是线程安全的,golang连接池的维度是transport, 在transport 里面维护了两个map,暂存连接。

    第二种情况是没设置 MaxIdleConnsPerHost, 和连接的timeout, 一旦高频的连接超过MaxIdleConnsPerHost 的数目,同时超过超时,连接就会释放。正确的设置是实例化transport 的时候,评估好 connsPerHost, 如下:

var DefaultTransport RoundTripper = &Transport{
        ... 
  MaxIdleConnsPerHost: 1000,
  IdleConnTimeout:       90 * time.Second,
        ... 
}

    第三种情况是resp.body 忘了读取,直接导致新请求会直接新建连接。其实可以理解,没read body 的socket, 如果直接复用,会产生什么样后果?所有使用这个套接字的连接都会错乱。 示例如下,

package main

import (
  "fmt"
  "html"
  "log"
  "net"
  "net/http"
  "time"
)

func startWebserver() {

  http.HandleFunc("/", func(w http.ResponseWriter, r *http.Request) {
      fmt.Fprintf(w, "Hello, %q", html.EscapeString(r.URL.Path))
  })

  go http.ListenAndServe(":8080", nil)

}

func startLoadTest() {
  count := 0
  for {
      resp, err := http.Get("http://localhost:8080/")
      if err != nil {
          panic(fmt.Sprintf("Got error: %v", err))
      }
      resp.Body.Close()
      log.Printf("Finished GET request #%v", count)
      count += 1
  }

}

func main() {

  // start a webserver in a goroutine
  startWebserver()

  startLoadTest()

}

    这里可以使用ss -s 查看连接数,如果不关心返回body ,可以直接丢弃

 io.Copy(ioutil.Discard, resp.Body)  //Discard 是一个 io.Writer,对它进行的任何 Write 调用都将无条件成功