在Go中,要了解channel,首先须要意识goroutine。
一、为什么会有goroutine
古代操作系统中为咱们提供了三种根本的结构并发程序的办法:多过程、I/O多路复用和多线程。其中最简略的结构形式当属多过程,然而多过程的并发程序,因为对过程管制和过程间通信开销微小,这样的并发形式往往会很慢。
因而,操作系统提供了更小粒度的运行单元:线程(确切叫法是内核线程)。它是一种运行在过程上下文中的逻辑流,线程之间通过操作系统来调度,其调度模型如下图所示。
多线程的并发形式,相较于多过程而言要快得多。然而因为线程上下文切换总是不可避免的陷入内核态,它的开销仍然较大。那么有没有不用陷入内核态的运行载体呢?有,用户级线程。 用户级线程的切换由用户程序本人管制,不须要内核干预,因而少了进出内核态的耗费。
这里的用户级线程就是协程(coroutine),它们的切换由运行时零碎来对立调度治理,内核并不知道它的存在。协程是形象于内核线程之上的对象,一个内核线程能够对应多个协程。但最终的零碎调用依然须要内核线程来实现。留神,线程的调度是操作系统来治理,是一种抢占式调度。而协程不同,协程之间须要单干,会被动交出执行权,是一种合作式调度,这也是为何被称为协程的起因。
Go天生在语言层面反对了协程,即咱们常说的goroutine。Go的runtime零碎实现的是一种M:N调度模型,通过GMP对象来形容,其中G代表的就是协程,M是线程,P是调度上下文。在Go程序中,一个goroutine就代表着一个最小用户代码执行流,它们也是并发流的最小单元。
二、channel的存在定位
从内存的角度而言,并发模型只分两种:基于共享内存和基于音讯通信(内存拷贝)。在Go中,两种并发模型的同步原语均有提供:sync.\和atomic.\代表的就是基于共享内存;channel代表的就是基于音讯通信。而Go提倡后者,它包含三大元素:goroutine(执行体),channel(通信),select(协调)。
Do not communicate by sharing memory; instead, share memory by communicating.
在Go中通过goroutine+channel的形式,能够简略、高效地解决并发问题,channel就是goroutine之间的数据桥梁。
Concurrency is the key to designing high performance network services. Go's concurrency primitives (goroutines and channels) provide a simple and efficient means of expressing concurrent execution.
以下是一个简略的channel应用示例代码。
func goroutineA(ch <-chan int) { fmt.Println("[goroutineA] want a data") val := <- ch fmt.Println("[goroutineA] received the data", val)}func goroutineB(ch chan<- int) { time.Sleep(time.Second*1) ch <- 1 fmt.Println("[goroutineB] send the data 1")}func main() { ch := make(chan int, 1) go goroutineA(ch) go goroutineB(ch) time.Sleep(2*time.Second)}
上述过程趣解图如下
三、channel源码解析
channel源码位于src/go/runtime/chan.go。本章内容分为两局部:channel内部结构和channel操作。
3.1 channel内部结构
ch := make(chan int,2)
对于以上channel的申明语句,咱们能够在程序中退出断点,失去ch的信息如下。
很好,看起来十分的清晰。然而,这些信息代表的是什么含意呢?接下来,咱们先看几个重要的构造体。
- hchan
当咱们通过make(chan Type, size)生成channel时,在runtime零碎中,生成的是一个hchan构造体对象。源码位于src/runtime/chan.go
type hchan struct { qcount uint // 循环队列中数据数 dataqsiz uint // 循环队列的大小 buf unsafe.Pointer // 指向大小为dataqsize的蕴含数据元素的数组指针 elemsize uint16 // 数据元素的大小 closed uint32 // 代表channel是否敞开 elemtype *_type // _type代表Go的类型零碎,elemtype代表channel中的元素类型 sendx uint // 发送索引号,初始值为0 recvx uint // 接管索引号,初始值为0 recvq waitq // 接管期待队列,存储试图从channel接收数据(<-ch)的阻塞goroutines sendq waitq // 发送期待队列,存储试图发送数据(ch<-)到channel的阻塞goroutines lock mutex // 加锁能爱护hchan的所有字段,包含waitq中sudoq对象}
- waitq
waitq用于表白处于阻塞状态的goroutines链表信息,first指向链头goroutine,last指向链尾goroutine
type waitq struct { first *sudog last *sudog}
- sudug
sudog代表的就是一个处于期待列表中的goroutine对象,源码位于src/runtime/runtime2.go
type sudog struct { g *g next *sudog prev *sudog elem unsafe.Pointer // data element (may point to stack) c *hchan // channel ...}
为了更好了解hchan构造体,咱们将通过以下代码来了解hchan中的字段含意。
package mainimport "time"func goroutineA(ch chan int) { ch <- 100}func goroutineB(ch chan int) { ch <- 200}func goroutineC(ch chan int) { ch <- 300}func goroutineD(ch chan int) { ch <- 300}func main() { ch := make(chan int, 4) for i := 0; i < 4; i++ { ch <- i * 10 } go goroutineA(ch) go goroutineB(ch) go goroutineC(ch) go goroutineD(ch) // 第一个sleep是为了给上足够的工夫让所有goroutine都已启动 time.Sleep(time.Millisecond * 500) time.Sleep(time.Second)}
关上代码调试性能,将程序运行至断点time.Sleep(time.Second)处,此时失去的chan信息如下。
在该channel中,通过make(chan int, 4)定义的channel大小为4,即dataqsiz的值为4。同时因为循环队列中曾经增加了4个元素,所以qcount值也为4。此时,有4个goroutine(A-D)想发送数据给channel,然而因为存放数据的循环队列已满,所以只能进入发送期待列表,即sendq。同时要留神到,此时的发送和接管索引值均为0,即下一次接收数据的goroutine会从循环队列的第一个元素拿,发送数据的goroutine会发送到循环队列的第一个地位。
上述hchan构造可视化图解如下
3.2 channel操作
将channel操作分为四局部:创立、发送、接管和敞开。
创立
本文的参考Go版本为1.15.2。其channel的创立实现代码位于src/go/runtime/chan.go的makechan办法。
func makechan(t *chantype, size int) *hchan { elem := t.elem // 发送元素大小限度 if elem.size >= 1<<16 { throw("makechan: invalid channel element type") } // 对齐查看 if hchanSize%maxAlign != 0 || elem.align > maxAlign { throw("makechan: bad alignment") } // 判断是否会内存溢出 mem, overflow := math.MulUintptr(elem.size, uintptr(size)) if overflow || mem > maxAlloc-hchanSize || size < 0 { panic(plainError("makechan: size out of range")) } // 为结构的hchan对象分配内存 var c *hchan switch { // 无缓冲的channel或者元素大小为0的状况 case mem == 0: c = (*hchan)(mallocgc(hchanSize, nil, true)) c.buf = c.raceaddr() // 元素不蕴含指针的状况 case elem.ptrdata == 0: c = (*hchan)(mallocgc(hchanSize+mem, nil, true)) c.buf = add(unsafe.Pointer(c), hchanSize) // 元素蕴含指针 default: c = new(hchan) c.buf = mallocgc(mem, elem, true) } // 初始化相干参数 c.elemsize = uint16(elem.size) c.elemtype = elem c.dataqsiz = uint(size) lockInit(&c.lock, lockRankHchan) if debugChan { print("makechan: chan=", c, "; elemsize=", elem.size, "; dataqsiz=", size, "\n") } return c}
能够看到,makechan办法次要就是查看传送元素的合法性,并为hchan分配内存,初始化相干参数,包含对锁的初始化。
发送
channel的发送实现代码位于src/go/runtime/chan.go的chansend办法。发送过程,存在以下几种状况。
- 当发送的channel为nil
if c == nil { if !block { return false } gopark(nil, nil, waitReasonChanSendNilChan, traceEvGoStop, 2) throw("unreachable")}
往一个nil的channel中发送数据时,调用gopark函数将以后执行的goroutine从running态转入waiting态。
- 往已敞开的channel中发送数据
if c.closed != 0 { unlock(&c.lock) panic(plainError("send on closed channel")) }
如果向已敞开的channel中发送数据,会引发panic。
- 如果曾经有阻塞的接管goroutines(即recvq中指向非空),那么数据将被间接发送给接管goroutine。
if sg := c.recvq.dequeue(); sg != nil { // Found a waiting receiver. We pass the value we want to send // directly to the receiver, bypassing the channel buffer (if any). send(c, sg, ep, func() { unlock(&c.lock) }, 3) return true}
该逻辑的实现代码在send办法和sendDirect中。
func send(c *hchan, sg *sudog, ep unsafe.Pointer, unlockf func(), skip int) { ... // 省略了竞态代码 if sg.elem != nil { sendDirect(c.elemtype, sg, ep) sg.elem = nil } gp := sg.g unlockf() gp.param = unsafe.Pointer(sg) if sg.releasetime != 0 { sg.releasetime = cputicks() } goready(gp, skip+1)}func sendDirect(t *_type, sg *sudog, src unsafe.Pointer) { dst := sg.elem typeBitsBulkBarrier(t, uintptr(dst), uintptr(src), t.size) memmove(dst, src, t.size)}
其中,memmove咱们曾经在源码系列中遇到屡次了,它的目标是将内存中src的内容拷贝至dst中去。另外,留神到goready(gp, skip+1)这句代码,它会使得之前在接管期待队列中的第一个goroutine的状态变为runnable,这样go的调度器就能够从新让该goroutine失去执行。
- 对于有缓冲的channel来说,如果以后缓冲区hchan.buf有可用空间,那么会将数据拷贝至缓冲区
if c.qcount < c.dataqsiz { qp := chanbuf(c, c.sendx) if raceenabled { raceacquire(qp) racerelease(qp) } typedmemmove(c.elemtype, qp, ep) // 发送索引号+1 c.sendx++ // 因为存储数据元素的构造是循环队列,所以当以后索引号曾经到队末时,将索引号调整到队头 if c.sendx == c.dataqsiz { c.sendx = 0 } // 以后循环队列中存储元素数+1 c.qcount++ unlock(&c.lock) return true}
其中,chanbuf(c, c.sendx)是获取指向对应内存区域的指针。typememmove会调用memmove办法,实现数据的拷贝工作。另外留神到,当对hchan进行实际操作时,是须要调用lock(&c.lock)加锁,因而,在实现数据拷贝后,通过unlock(&c.lock)将锁开释。
- 有缓冲的channel,当hchan.buf已满;或者无缓冲的channel,以后没有接管的goroutine
gp := getg()mysg := acquireSudog()mysg.releasetime = 0if t0 != 0 { mysg.releasetime = -1}// No stack splits between assigning elem and enqueuing mysg// on gp.waiting where copystack can find it.mysg.elem = epmysg.waitlink = nilmysg.g = gpmysg.isSelect = falsemysg.c = cgp.waiting = mysggp.param = nilc.sendq.enqueue(mysg)gopark(chanparkcommit, unsafe.Pointer(&c.lock), waitReasonChanSend, traceEvGoBlockSend, 2)
通过getg获取以后执行的goroutine。acquireSudog是先取得以后执行goroutine的线程M,再获取M对应的P,最初将P的sudugo缓存队列中的队头sudog取出(详见源码src/runtime/proc.go)。通过c.sendq.enqueue将sudug退出到channel的发送期待列表中,并调用gopark将以后goroutine转为waiting态。
- 发送操作会对hchan加锁。
- 当recvq中存在期待接管的goroutine时,数据元素将会被间接拷贝给接管goroutine。
- 当recvq期待队列为空时,会判断hchan.buf是否可用。如果可用,则会将发送的数据拷贝至hchan.buf中。
- 如果hchan.buf已满,那么将以后发送goroutine置于sendq中排队,并在运行时中挂起。
- 向曾经敞开的channel发送数据,会引发panic。
对于无缓冲的channel来说,它人造就是hchan.buf已满的状况,因为它的hchan.buf的容量为0。
package mainimport "time"func main() { ch := make(chan int) go func(ch chan int) { ch <- 100 }(ch) time.Sleep(time.Millisecond * 500) time.Sleep(time.Second)}
在上述示例中,发送goroutine向无缓冲的channel发送数据,然而没有接管goroutine。将断点置于time.Sleep(time.Second),失去此时ch构造如下。
能够看到,在无缓冲的channel中,其hchan的buf长度为0,当没有接管groutine时,发送的goroutine将被置于sendq的发送队列中。
接管
channel的接管实现分两种,v :=<-ch对应于chanrecv1,v, ok := <- ch对应于chanrecv2,但它们都依赖于位于src/go/runtime/chan.go的chanrecv办法。
func chanrecv1(c *hchan, elem unsafe.Pointer) { chanrecv(c, elem, true)}func chanrecv2(c *hchan, elem unsafe.Pointer) (received bool) { _, received = chanrecv(c, elem, true) return}
chanrecv的具体代码此处就不再展现,和chansend逻辑对应,具体解决准则如下。
- 接管操作会对hchan加锁。
- 当sendq中存在期待发送的goroutine时,意味着此时的hchan.buf已满(无缓存的人造已满),分两种状况(见代码src/go/runtime/chan.go的recv办法):1. 如果是有缓存的hchan,那么先将缓冲区的数据拷贝给接管goroutine,再将sendq的队头sudog出队,将出队的sudog上的元素拷贝至hchan的缓存区。 2. 如果是无缓存的hchan,那么间接将出队的sudog上的元素拷贝给接管goroutine。两种状况的最初都会唤醒出队的sudog上的发送goroutine。
- 当sendq发送队列为空时,会判断hchan.buf是否可用。如果可用,则会将hchan.buf的数据拷贝给接管goroutine。
- 如果hchan.buf不可用,那么将以后接管goroutine置于recvq中排队,并在运行时中挂起。
- 与发送不同的是,当channel敞开时,goroutine还能从channel中获取数据。如果recvq期待列表中有goroutines,那么它们都会被唤醒接收数据。如果hchan.buf中还有未接管的数据,那么goroutine会接收缓冲区中的数据,否则goroutine会获取到元素的零值。
以下是channel敞开之后,接管goroutine的读取示例代码。
func main() { ch := make(chan int, 1) ch <- 10 close(ch) a, ok := <-ch fmt.Println(a, ok) b, ok := <-ch fmt.Println(b, ok) c := <-ch fmt.Println(c)}//输入如下10 true0 false0
留神:在channel中进行的所有元素转移都随同着内存的拷贝。
func main() { type Instance struct { ID int name string } var ins = Instance{ID: 1, name: "Golang"} ch := make(chan Instance, 3) ch <- ins fmt.Println("ins的原始值:", ins) ins.name = "Python" go func(ch chan Instance) { fmt.Println("channel接管值:", <-ch) }(ch) time.Sleep(time.Second) fmt.Println("ins的最终值:", ins)}// 输入后果ins的原始值: {1 Golang}channel接管值: {1 Golang}ins的最终值: {1 Python}
前半段图解如下
后半段图解如下
留神,如果把channel传递类型替换为Instance指针时,那么只管channel存入到buf中的元素曾经是拷贝对象了,从channel中取出又被拷贝了一次。然而因为它们的类型是Instance指针,拷贝对象与原始对象均会指向同一个内存地址,批改原有元素对象的数据时,会影响到取出数据。
func main() { type Instance struct { ID int name string } var ins = &Instance{ID: 1, name: "Golang"} ch := make(chan *Instance, 3) ch <- ins fmt.Println("ins的原始值:", ins) ins.name = "Python" go func(ch chan *Instance) { fmt.Println("channel接管值:", <-ch) }(ch) time.Sleep(time.Second) fmt.Println("ins的最终值:", ins)}// 输入后果ins的原始值: &{1 Golang}channel接管值: &{1 Python}ins的最终值: &{1 Python}
因而,在应用channel时,尽量避免传递指针,如果传递指针,则需谨慎。
敞开
channel的敞开实现代码位于src/go/runtime/chan.go的chansend办法,具体执行逻辑已通过正文写明。
func closechan(c *hchan) { // 如果hchan对象为nil,则会引发painc if c == nil { panic(plainError("close of nil channel")) } // 对hchan加锁 lock(&c.lock) // 不同屡次调用close(c chan<- Type)办法,否则会引发painc if c.closed != 0 { unlock(&c.lock) panic(plainError("close of closed channel")) } if raceenabled { callerpc := getcallerpc() racewritepc(c.raceaddr(), callerpc, funcPC(closechan)) racerelease(c.raceaddr()) } // close标记 c.closed = 1 // gList代表Go的GMP调度的G汇合 var glist gList // 该for循环是为了开释recvq上的所有期待接管sudog for { sg := c.recvq.dequeue() if sg == nil { break } if sg.elem != nil { typedmemclr(c.elemtype, sg.elem) sg.elem = nil } if sg.releasetime != 0 { sg.releasetime = cputicks() } gp := sg.g gp.param = nil if raceenabled { raceacquireg(gp, c.raceaddr()) } glist.push(gp) } // 该for循环会开释sendq上的所有期待发送sudog for { sg := c.sendq.dequeue() if sg == nil { break } sg.elem = nil if sg.releasetime != 0 { sg.releasetime = cputicks() } gp := sg.g gp.param = nil if raceenabled { raceacquireg(gp, c.raceaddr()) } glist.push(gp) } // 开释sendq和recvq之后,hchan开释锁 unlock(&c.lock) // 将上文中glist中的退出的goroutine取出,让它们均变为runnable(可执行)状态,期待调度器执行 // 留神:咱们上文中剖析过,试图向一个已敞开的channel发送数据,会引发painc。 // 所以,如果是开释sendq中的goroutine,它们一旦失去执行将会引发panic。 for !glist.empty() { gp := glist.pop() gp.schedlink = 0 goready(gp, 3) }}
对于敞开操作,有几个点须要留神一下。
- 如果敞开已敞开的channel会引发painc。
- 对channel敞开后,如果有阻塞的读取或发送goroutines将会被唤醒。读取goroutines会获取到hchan的已接管元素,如果没有,则获取到元素零值;发送goroutine的执行则会引发painc。
对于第二点,咱们能够很好利用这一个性来实现对程序执行流的管制(相似于sync.WaitGroup的作用),以下是示例程序代码。
func main() { ch := make(chan struct{}) // go func() { // do something work... // when work has done, call close() close(ch) }() // waiting work done <- ch // other work continue...}
四、总结
channel是Go中十分弱小有用的机制,为了更无效地应用它,咱们必须理解它的实现原理,这也是写作本文的目标。
- hchan构造体有锁的保障,对于并发goroutine而言是平安的
- channel接管、发送数据遵循FIFO(First In First Out)原语
- channel的数据传递依赖于内存拷贝
- channel能阻塞(gopark)、唤醒(goready)goroutine
- 所谓无缓存的channel,它的工作形式就是间接发送goroutine拷贝数据给接管goroutine,而不通过hchan.buf
另外,能够看到Go在channel的设计上衡量了简略与性能。为了简略性,hchan是有锁的构造,因为有锁的队列会更易了解和实现,然而这样会损失一些性能。思考到整个 channel 操作带锁的老本较高,其实官网也曾思考过应用无锁 channel 的设计,然而因为目前已有提案中(https://github.com/golang/go/...),无锁实现的channel可维护性差、且理论性能测试不具备说服力,而且也不合乎Go的简略哲学,因而官网目前为止并没有驳回无锁设计。
在性能上,有一点,咱们须要意识到:所谓channel中阻塞goroutine,只是在runtime零碎中被blocked,它是用户层的阻塞。而理论的底层内核线程不受影响,它依然是unblocked的。
参考链接
https://speakerdeck.com/kavya...
https://codeburst.io/diving-d...
https://github.com/talkgo/nig...