简介
简直所有的编程语言都以Hello World
作为入门程序的示例,其中有一部分以编写一个 Web 服务器作为实战案例的开始。每种编程语言都有很多用于编写 Web 服务器的库,或以规范库,或通过第三方库的形式提供。Go 语言也不例外。本文及后续的文章就去摸索 Go 语言中的各个Web 编程框架,它们的根本应用,浏览它们的源码,比拟它们优缺点。让咱们先从 Go 语言的规范库net/http
开始。规范库net/http
让编写 Web 服务器的工作变得非常简单。咱们一起摸索如何应用net/http
库实现一些常见的性能或模块,理解这些对咱们学习其余的库或框架将会很有帮忙。
Hello World
应用net/http
编写一个简略的 Web 服务器非常简单:
package mainimport ( "fmt" "net/http")func index(w http.ResponseWriter, r *http.Request) { fmt.Fprintln(w, "Hello World")}func main() { http.HandleFunc("/", index) http.ListenAndServe(":8080", nil)}
首先,咱们调用http.HandleFunc("/", index)
注册门路处理函数,这里将门路/
的处理函数设置为index
。处理函数的类型必须是:
func (http.ResponseWriter, *http.Request)
其中*http.Request
示意 HTTP 申请对象,该对象蕴含申请的所有信息,如 URL、首部、表单内容、申请的其余内容等。
http.ResponseWriter
是一个接口类型:
// net/http/server.gotype ResponseWriter interface { Header() Header Write([]byte) (int, error) WriteHeader(statusCode int)}
用于向客户端发送响应,实现了ResponseWriter
接口的类型显然也实现了io.Writer
接口。所以在处理函数index
中,能够调用fmt.Fprintln()
向ResponseWriter
写入响应信息。
仔细阅读net/http
包中HandleFunc()
函数的源码:
func HandleFunc(pattern string, handler func(ResponseWriter, *Request)) { DefaultServeMux.HandleFunc(pattern, handler)}
咱们发现它间接调用了一个名为DefaultServeMux
对象的HandleFunc()
办法。DefaultServeMux
是ServeMux
类型的实例:
type ServeMux struct { mu sync.RWMutex m map[string]muxEntry es []muxEntry // slice of entries sorted from longest to shortest. hosts bool // whether any patterns contain hostnames}var DefaultServeMux = &defaultServeMuxvar defaultServeMux ServeMux
像这种提供默认类型实例的用法在 Go 语言的各个库中十分常见,在默认参数就曾经足够的场景中应用默认实现很不便。ServeMux
保留了注册的所有门路和处理函数的对应关系。ServeMux.HandleFunc()
办法如下:
func (mux *ServeMux) HandleFunc(pattern string, handler func(ResponseWriter, *Request)) { mux.Handle(pattern, HandlerFunc(handler))}
这里将处理函数handler
转为HandlerFunc
类型,而后调用ServeMux.Handle()
办法注册。留神这里的HandlerFunc(handler)
是类型转换,而非函数调用,类型HandlerFunc
的定义如下:
type HandlerFunc func(ResponseWriter, *Request)func (f HandlerFunc) ServeHTTP(w ResponseWriter, r *Request) { f(w, r)}
HandlerFunc
实际上是以函数类型func(ResponseWriter, *Request)
为底层类型,为HandlerFunc
类型定义了办法ServeHTTP
。是的,Go 语言容许为(基于)函数的类型定义办法。Serve.Handle()
办法只承受类型为接口Handler
的参数:
type Handler interface { ServeHTTP(ResponseWriter, *Request)}func (mux *ServeMux) Handle(pattern string, handler Handler) { if mux.m == nil { mux.m = make(map[string]muxEntry) } e := muxEntry{h: handler, pattern: pattern} if pattern[len(pattern)-1] == '/' { mux.es = appendSorted(mux.es, e) } mux.m[pattern] = e}
显然HandlerFunc
实现了接口Handler
。HandlerFunc
类型只是为了不便注册函数类型的处理器。咱们当然能够间接定义一个实现Handler
接口的类型,而后注册该类型的实例:
type greeting stringfunc (g greeting) ServeHTTP(w http.ResponseWriter, r *http.Request) { fmt.Fprintln(w, g)}http.Handle("/greeting", greeting("Welcome, dj"))
咱们基于string
类型定义了一个新类型greeting
,而后为它定义一个办法ServeHTTP()
(实现接口Handler
),最初调用http.Handle()
办法注册该处理器。
为了便于辨别,咱们将通过HandleFunc()
注册的称为处理函数,将通过Handle()
注册的称为处理器。通过下面的源码剖析不难看出,它们在底层实质上是一回事。
注册了解决逻辑后,调用http.ListenAndServe(":8080", nil)
监听本地计算机的 8080 端口,开始解决申请。上面看源码的解决:
func ListenAndServe(addr string, handler Handler) error { server := &Server{Addr: addr, Handler: handler} return server.ListenAndServe()}
ListenAndServe
创立了一个Server
类型的对象:
type Server struct { Addr string Handler Handler TLSConfig *tls.Config ReadTimeout time.Duration ReadHeaderTimeout time.Duration WriteTimeout time.Duration IdleTimeout time.Duration}
Server
构造体有比拟多的字段,咱们能够应用这些字段来调节 Web 服务器的参数,如下面的ReadTimeout/ReadHeaderTimeout/WriteTimeout/IdleTimeout
用于管制读写和闲暇超时。在该办法中,先调用net.Listen()
监听端口,将返回的net.Listener
作为参数调用Server.Serve()
办法:
func (srv *Server) ListenAndServe() error { addr := srv.Addr ln, err := net.Listen("tcp", addr) if err != nil { return err } return srv.Serve(ln)}
在Server.Serve()
办法中,应用一个有限的for
循环,不停地调用Listener.Accept()
办法承受新连贯,开启新 goroutine 解决新连贯:
func (srv *Server) Serve(l net.Listener) error { var tempDelay time.Duration // how long to sleep on accept failure for { rw, err := l.Accept() if err != nil { if ne, ok := err.(net.Error); ok && ne.Temporary() { if tempDelay == 0 { tempDelay = 5 * time.Millisecond } else { tempDelay *= 2 } if max := 1 * time.Second; tempDelay > max { tempDelay = max } srv.logf("http: Accept error: %v; retrying in %v", err, tempDelay) time.Sleep(tempDelay) continue } return err } tempDelay = 0 c := srv.newConn(rw) go c.serve(connCtx) }}
这里有一个指数退却策略的用法。如果l.Accept()
调用返回谬误,咱们判断该谬误是不是临时性地(ne.Temporary()
)。如果是临时性谬误,Sleep
一小段时间后重试,每产生一次临时性谬误,Sleep
的工夫翻倍,最多Sleep
1s。取得新连贯后,将其封装成一个conn
对象(srv.newConn(rw)
),创立一个 goroutine 运行其serve()
办法。省略无关逻辑的代码如下:
func (c *conn) serve(ctx context.Context) { for { w, err := c.readRequest(ctx) serverHandler{c.server}.ServeHTTP(w, w.req) w.finishRequest() }}
serve()
办法其实就是不停地读取客户端发送地申请,创立serverHandler
对象调用其ServeHTTP()
办法去解决申请,而后做一些清理工作。serverHandler
只是一个两头的辅助构造,代码如下:
type serverHandler struct { srv *Server}func (sh serverHandler) ServeHTTP(rw ResponseWriter, req *Request) { handler := sh.srv.Handler if handler == nil { handler = DefaultServeMux } handler.ServeHTTP(rw, req)}
从Server
对象中获取Handler
,这个Handler
就是调用http.ListenAndServe()
时传入的第二个参数。在Hello World
的示例代码中,咱们传入了nil
。所以这里handler
会取默认值DefaultServeMux
。调用DefaultServeMux.ServeHTTP()
办法解决申请:
func (mux *ServeMux) ServeHTTP(w ResponseWriter, r *Request) { h, _ := mux.Handler(r) h.ServeHTTP(w, r)}
mux.Handler(r)
通过申请的门路信息查找处理器,而后调用处理器的ServeHTTP()
办法解决申请:
func (mux *ServeMux) Handler(r *Request) (h Handler, pattern string) { host := stripHostPort(r.Host) return mux.handler(host, r.URL.Path)}func (mux *ServeMux) handler(host, path string) (h Handler, pattern string) { h, pattern = mux.match(path) return}func (mux *ServeMux) match(path string) (h Handler, pattern string) { v, ok := mux.m[path] if ok { return v.h, v.pattern } for _, e := range mux.es { if strings.HasPrefix(path, e.pattern) { return e.h, e.pattern } } return nil, ""}
下面的代码省略了大量的无关代码,在match
办法中,首先会查看门路是否准确匹配mux.m[path]
。如果不能准确匹配,前面的for
循环会匹配门路的最长前缀。只有注册了/
根门路解决,所有未匹配到的门路最终都会交给/
门路解决。为了保障最长前缀优先,在注册时,会对门路进行排序。所以mux.es
中寄存的是按门路排序的解决列表:
func appendSorted(es []muxEntry, e muxEntry) []muxEntry { n := len(es) i := sort.Search(n, func(i int) bool { return len(es[i].pattern) < len(e.pattern) }) if i == n { return append(es, e) } es = append(es, muxEntry{}) copy(es[i+1:], es[i:]) es[i] = e return es}
运行,在浏览器中键入网址localhost:8080
,能够看到网页显示Hello World
。键入网址localhost:8080/greeting
,看到网页显示Welcome, dj
。
思考题:
依据最长前缀的逻辑,如果键入localhost:8080/greeting/a/b/c
,应该会匹配/greeting
门路。
如果键入localhost:8080/a/b/c
,应该会匹配/
门路。是这样么?答案放在前面。
创立ServeMux
调用http.HandleFunc()/http.Handle()
都是将处理器/函数注册到ServeMux
的默认对象DefaultServeMux
上。应用默认对象有一个问题:不可控。
一来Server
参数都应用了默认值,二来第三方库也可能应用这个默认对象注册一些解决,容易抵触。更重大的是,咱们在不知情中调用http.ListenAndServe()
开启 Web 服务,那么第三方库注册的解决逻辑就能够通过网络拜访到,有极大的安全隐患。所以,除非在示例程序中,否则倡议不要应用默认对象。
咱们能够应用http.NewServeMux()
创立一个新的ServeMux
对象,而后创立http.Server
对象定制参数,用ServeMux
对象初始化Server
的Handler
字段,最初调用Server.ListenAndServe()
办法开启 Web 服务:
func main() { mux := http.NewServeMux() mux.HandleFunc("/", index) mux.Handle("/greeting", greeting("Welcome to go web frameworks")) server := &http.Server{ Addr: ":8080", Handler: mux, ReadTimeout: 20 * time.Second, WriteTimeout: 20 * time.Second, } server.ListenAndServe()}
这个程序与下面的Hello World
性能基本相同,咱们还额定设置了读写超时。
为了便于了解,我画了两幅图,其实整顿下来整个流程也不简单:
中间件
有时候须要在申请解决代码中减少一些通用的逻辑,如统计解决耗时、记录日志、捕捉宕机等等。如果在每个申请处理函数中增加这些逻辑,代码很快就会变得不可保护,增加新的处理函数也会变得十分繁琐。所以就有了中间件的需要。
中间件有点像面向切面的编程思维,然而与 Java 语言不同。在 Java 中,通用的解决逻辑(也能够称为切面)能够通过反射插入到失常逻辑的解决流程中,在 Go 语言中根本不这样做。
在 Go 中,中间件是通过函数闭包来实现的。Go 语言中的函数是第一类值,既能够作为参数传给其余函数,也能够作为返回值从其余函数返回。咱们后面介绍了处理器/函数的应用和实现。那么能够利用闭包封装已有的处理函数。
首先,基于函数类型func(http.Handler) http.Handler
定义一个中间件类型:
type Middleware func(http.Handler) http.Handler
接下来咱们来编写中间件,最简略的中间件就是在申请前后各输入一条日志:
func WithLogger(handler http.Handler) http.Handler { return http.HandlerFunc(func(w http.ResponseWriter, r *http.Request) { logger.Printf("path:%s process start...\n", r.URL.Path) defer func() { logger.Printf("path:%s process end...\n", r.URL.Path) }() handler.ServeHTTP(w, r) })}
实现很简略,通过中间件封装原来的处理器对象,而后返回一个新的处理函数。在新的处理函数中,先输入开始解决的日志,而后用defer
语句在函数完结后输入解决完结的日志。接着调用原处理器对象的ServeHTTP()
办法执行原解决逻辑。
相似地,咱们再来实现一个统计解决耗时的中间件:
func Metric(handler http.Handler) http.HandlerFunc { return func (w http.ResponseWriter, r *http.Request) { start := time.Now() defer func() { logger.Printf("path:%s elapsed:%fs\n", r.URL.Path, time.Since(start).Seconds()) }() time.Sleep(1 * time.Second) handler.ServeHTTP(w, r) }}
Metric
中间件封装原处理器对象,开始执行前记录时间,执行实现后输入耗时。为了能不便看到后果,我在下面代码中增加了一个time.Sleep()
调用。
最初,因为申请的解决逻辑都是由性能开发人员(而非库作者)本人编写的,所以为了 Web 服务器的稳固,咱们须要捕捉可能呈现的 panic。PanicRecover
中间件如下:
func PanicRecover(handler http.Handler) http.Handler { return http.HandlerFunc(func(w http.ResponseWriter, r *http.Request) { defer func() { if err := recover(); err != nil { logger.Println(string(debug.Stack())) } }() handler.ServeHTTP(w, r) })}
调用recover()
函数捕捉 panic,输入堆栈信息,为了避免程序异样退出。实际上,在conn.serve()
办法中也有recover()
,程序个别不会异样退出。然而自定义的中间件能够增加咱们本人的定制逻辑。
当初咱们能够这样来注册处理函数:
mux.Handle("/", PanicRecover(WithLogger(Metric(http.HandlerFunc(index)))))mux.Handle("/greeting", PanicRecover(WithLogger(Metric(greeting("welcome, dj")))))
这种形式略显繁琐,咱们能够编写一个帮忙函数,它承受原始的处理器对象,和可变的多个中间件。对处理器对象利用这些中间件,返回新的处理器对象:
func applyMiddlewares(handler http.Handler, middlewares ...Middleware) http.Handler { for i := len(middlewares)-1; i >= 0; i-- { handler = middlewares[i](handler) } return handler}
留神利用程序是从右到左的,即右联合,越凑近原处理器的越晚执行。
利用帮忙函数,注册能够简化为:
middlewares := []Middleware{ PanicRecover, WithLogger, Metric,}mux.Handle("/", applyMiddlewares(http.HandlerFunc(index), middlewares...))mux.Handle("/greeting", applyMiddlewares(greeting("welcome, dj"), middlewares...))
下面每次注册解决逻辑都须要调用一次applyMiddlewares()
函数,还是略显繁琐。咱们能够这样来优化,封装一个本人的ServeMux
构造,而后定义一个办法Use()
将中间件保留下来,重写Handle/HandleFunc
将传入的http.HandlerFunc/http.Handler
处理器包装中间件之后再传给底层的ServeMux.Handle()
办法:
type MyMux struct { *http.ServeMux middlewares []Middleware}func NewMyMux() *MyMux { return &MyMux{ ServeMux: http.NewServeMux(), }}func (m *MyMux) Use(middlewares ...Middleware) { m.middlewares = append(m.middlewares, middlewares...)}func (m *MyMux) Handle(pattern string, handler http.Handler) { handler = applyMiddlewares(handler, m.middlewares...) m.ServeMux.Handle(pattern, handler)}func (m *MyMux) HandleFunc(pattern string, handler http.HandlerFunc) { newHandler := applyMiddlewares(handler, m.middlewares...) m.ServeMux.Handle(pattern, newHandler)}
注册时只须要创立MyMux
对象,调用其Use()
办法传入要利用的中间件即可:
middlewares := []Middleware{ PanicRecover, WithLogger, Metric,}mux := NewMyMux()mux.Use(middlewares...)mux.HandleFunc("/", index)mux.Handle("/greeting", greeting("welcome, dj"))
这种形式简略易用,然而也有它的问题,最大的问题是必须先设置好中间件,而后能力调用Handle/HandleFunc
注册,后增加的中间件不会对之前注册的处理器/函数失效。
为了解决这个问题,咱们能够改写ServeHTTP
办法,在确定了处理器之后再利用中间件。这样后续增加的中间件也能失效。很多第三方库都是采纳这种形式。http.ServeMux
默认的ServeHTTP()
办法如下:
func (m *ServeMux) ServeHTTP(w http.ResponseWriter, r *http.Request) { if r.RequestURI == "*" { if r.ProtoAtLeast(1, 1) { w.Header().Set("Connection", "close") } w.WriteHeader(http.StatusBadRequest) return } h, _ := m.Handler(r) h.ServeHTTP(w, r)}
革新这个办法定义MyMux
类型的ServeHTTP()
办法也很简略,只须要在m.Handler(r)
获取处理器之后,利用以后的中间件即可:
func (m *MyMux) ServeHTTP(w http.ResponseWriter, r *http.Request) { // ... h, _ := m.Handler(r) // 只须要加这一行即可 h = applyMiddlewares(h, m.middlewares...) h.ServeHTTP(w, r)}
前面咱们剖析其余 Web 框架的源码时会发现,很多都是相似的做法。为了测试宕机复原,编写一个会触发 panic 的处理函数:
func panics(w http.ResponseWriter, r *http.Request) { panic("not implemented")}mux.HandleFunc("/panic", panics)
运行,在浏览器中申请localhost:8080/
和localhost:8080/greeting
,最初申请localhost:8080/panic
触发 panic:
思考题
思考题:
这其实就是看浏览代码是不是认真,最长前缀的排序列表在ServeMux.Handle()
办法中生成:
func (mux *ServeMux) Handle(pattern string, handler Handler) { if pattern[len(pattern)-1] == '/' { mux.es = appendSorted(mux.es, e) }}
这里显著有个限度条件,即注册门路最初必须以/
结尾才会触发。所以localhost:8080/greeting/a/b/c
和localhost:8080/a/b/c
都只会匹配/
门路。如果想要让localhost:8080/greeting/a/b/c
匹配门路/greeting
,注册门路须要改为/greeting/
:
http.Handle("/greeting/", greeting("Welcome to go web frameworks"))
这时申请门路/greeting
会主动重定向(301)到/greeting/
。
总结
本文介绍了应用规范库net/http
创立 Web 服务器的根本流程,一步步剖析源码。而后介绍了如何应用中间件简化通用的解决逻辑。学习并了解了net/http
库的内容对于学习其余的 Go Web 框架十分有帮忙。第三方的 Go Web 框架大多也是基于net/http
实现本人的ServeMux
对象而已。
大家如果发现好玩、好用的 Go 语言库,欢送到 Go 每日一库 GitHub 上提交 issue
参考
- Go 每日一库 GitHub:https://github.com/darjun/go-daily-lib
我
我的博客:https://darjun.github.io
欢送关注我的微信公众号【GoUpUp】,独特学习,一起提高~