net/http

请求连接的管理

golang 中, 连接的管理采用 Reactor 模式。每个请求到达服务器之后,都会分配一个 goroutine 做任务处理。

 func (srv *Server) Serve(l net.Listener) error {
  // ... 初始化和验证listener
  // ... 构造 context
  for {
    rw, e := l.Accept()
    if e != nil {
      select {
      case <-srv.getDoneChan():
        return ErrServerClosed
      default:
      }
      // ... 若为临时错误,启动重试机制
      // 否则退出
    }
    tempDelay = 0
    c := srv.newConn(rw)
    c.setState(c.rwc, StateNew)
    // 创建goroutine, 单独处理连接
    go c.serve(ctx)
  }
}

我们在处理 http 请求时,不同请求在不同goroutine中,因此需要注意并发请求数据共享的问题。

连接的状态

Server 在Accept 后创建连接(conn),连接可能有多种状态。通过连接的状态转移,可以方便我们了解一个conn 的处理流程。下面是状态的转移图:

当Accept后,构建了新的连接,状态将标记为New。如果可以读取数据,连接将标记为Active(即,活动的Conn)。作为一个活动的Conn,可能在处理完毕后变为Idle状态用于请求复用;也有可能因为请求协议故障,变为Close状态;也有可能被服务调用方直接管理Conn,状态变更为Hijacked 状态。

Hijacked 状态下,Conn 被使用方自行管理,一般用于协议升级的情况。例如:通过http 请求后,协议升级为websocket 请求,或者Rpc 请求等。

连接的处理

做http 的连接处理,重点有几个方面:① 通过连接读取数据,并做协议分析和处理;②对http请求做处理(我们正常需要做的业务处理);③ 连接的复用和升级。

首先,我们看看整体的处理流程:

// Serve a new connection.
func (c *conn) serve(ctx context.Context) {
  // ... defer 处理异常退出 和连接关闭
  // ... tls 握手
  // 初始化conn 的读写
  // 对于keeplive 循环处理请求
  for {
    // ①② 读取/处理请求头 构造了Request,Response
    w, err := c.readRequest(ctx)
    // ... 连接状态变更 && 异常处理
    // 对  Except 100-continue 的特殊处理。
    // 原子包裹 response 对象
    c.curReq.Store(w)
    // 异步读取Body (此处也有对 except 100 的处理)
    // ③ 传入 request 和 response 处理 handler
    serverHandler{c.server}.ServeHTTP(w, w.req)
    // 连接复用判断, 复用则退出
    // 请求结束,写header 和resp,并关闭req
    w.finishRequest()
    if !w.shouldReuseConnection() {
      if w.requestBodyLimitHit || w.closedRequestBodyEarly() {
        c.closeWriteAndWait()
      }
      return
    }
    // 更改状态,释放 response
    // 如果不需要keeplive, 连接将被关闭
    if !w.conn.server.doKeepAlives() {
      return
    }
    // 判断是否超时,连接是否可用, 若不可用则关闭
    // 重新设置超时
    c.rwc.SetReadDeadline(time.Time{})
  }
}

从代码中可以看出,除了需要做Http 的解析外,还需要不断判断Conn 的状态。当进入Hijack状态后,不再控制Conn;当连接异常后,不再处理请求;当keeplive后,需要复用连接;超时之后,对连接的关闭等。此外,还需要对http 协议做适配处理,例如 对 Except: 100-continue的支持等。

对于每个请求,我们都会有一个 Request 和 Response 对象,分别标识一个请求和响应。从Request 中读取请求Body,将我们的响应写入Response对象中。下面我们来看看Server端是如何构造这两个对象的。

Request 的构造

  1. 首先是对协议头的解析,获取请求的方法、请求Url,协议等,如果是代理模式,还会做Url的替换。

  2. 然后会解析Header,在Server 中,Golang 的Header 数据是存储在 map[string][]string 结构中,Key 采用大驼峰和连字符描述。

  • 对于Pragma:no-cache 的请求,标识 Cache-control:No-cache

  • 对于Connection: close 的请求,不再keeplive

  • 构造 Request 传输控制的数据:

    • Transfer-Encoding 的修正

    • Content-Length 的修正

    • chunk 模式下的Trailer修正

    • Body 的构造

  • PRI header 对Http2的支持。(需要通过HiJack 支持)

  • Response 的构造

    Response 作为服务的响应节点,比较简单,初始化后,创建一个写缓冲区即可:

      w = &response{
        conn:          c,
        cancelCtx:     cancelCtx,
        req:           req,
        reqBody:       req.Body,
        handlerHeader: make(Header),
        contentLength: -1,
        closeNotifyCh: make(chan bool, 1),
        // We populate these ahead of time so we're not
        // reading from req.Header after their Handler starts
        // and maybe mutates it (Issue 14940)
        wants10KeepAlive: req.wantsHttp10KeepAlive(),
        wantsClose:       req.wantsClose(),
      }
      w.cw.res = w   // chunkWriter
      //创建 一个写的缓冲区,(Writer 从 sync.Pool 中共享)
      w.w = newBufioWriterSize(&w.cw, bufferBeforeChunkingSize)
    

    Handler 的处理

    Http Server 是为了我们的业务处理服务的。在构造了Request 和 Response 对象后,最终的目的就是为了处理我们的业务逻辑。

    在 http Server 中, 构造了 serverHandler 对象完成我们的业务逻辑, serverHandler 中,调用handler.ServerHTTP 方法,我们业务逻辑需要定义一个Handler,handler实现 ServerHTTP 方法即可。

    type Handler interface {
      ServeHTTP(ResponseWriter, *Request)
    }
    type serverHandler struct {
      srv *Server
    }
    func (sh serverHandler) ServeHTTP(rw ResponseWriter, req *Request) {
      handler := sh.srv.Handler
      if handler == nil {
        handler = DefaultServeMux
      }
      if req.RequestURI == "*" && req.Method == "OPTIONS" {
        handler = globalOptionsHandler{}
      }
      handler.ServeHTTP(rw, req)
    }
    

    http 包中也通过实现 Handler 接口 提供了一些基础的结构体方便我们使用。例如:

    1. ServeMux 结构体。这个ServerMux 实现了可以定义路径和Handler映射(简单路由)功能的 Handler,方便我们定义路由。内部还定义了一个默认的DefaultServeMux,我们可以通过如下方法做默认路由的映射(可以从上面方法看到,如果没有定义handler,将使用DefaultServeMux):

    • Handle(pattern string, handler Handler){}

    • HandleFunc(pattern string, handler func(ResponseWrite, *Request)){}

  • timeoutHandler 结构体。通过 NewTestTimeoutHandler 方法可以构造一个带超时功能的handler。

  • redirectHandler 结构体。通过 RedirectHandler 方法可以实现对连接的重定向。

  • fileHandler 结构体。通过 FileServer(root FileSystem) 方法可以构造一个fileHandler 结构体,从而实现一个文件服务器。

  • 当然,在很多web框架的实现中,比如gin, iris 等,在实现内部的路由时,均是通过实现一个Handler 接口,在Handler接口中实现了对应的路由转发功能的。

    总结

    1. 一个 Http 请求,至少会启动两个goroutine。一个groutine用来处理请求,另一个goroutine 用来异步读取body 数据。

    2. 2.Server 实现中,对协议升级做了充分的考虑。可以通过 Hijack 手段, 将我们的协议从 Http 升级为 WebSocket, RPC,或者其他TCP协议。

    几个比较特殊的 Http 协议规则

    还有一些http 协议规则的实现,我们在后续的文章做仔细的分析。例如:

    1. Http Except: 100-continue 协议

    2. Http CONNECT METHOD, 不仅会用在代理模式的Http Server中,还有可能用在RPC中。

    3. Chunk 模式, Trailer 设置等。