工作中常常会遇到一些批量解决数据的需要,如果这些数据的解决没有逻辑上的先后顺序,这时候就正好能够应用Golang的并发编程来晋升效率了,话不多说,上代码:
package mainimport ( "fmt" "sync")func main() { //初始化管道来接管工作数据 ch := make(chan int, 10000) //所有工作执行结束才完结过程 wg := &sync.WaitGroup{} //用来管制协程数量,超过50个会阻塞 pool := make(chan struct{}, 50) //工作数量 count := 1000 go producer(ch, count, wg) consumer(ch, pool, wg) wg.Wait() fmt.Println("工作处理完毕")}//生产者func producer(ch chan int, count int, wg *sync.WaitGroup) { defer close(ch) wg.Add(count) for i := 0; i < count; i++ { ch <- i fmt.Println("工作", i, "生产结束") }}//消费者func consumer(ch chan int, pool chan struct{}, wg *sync.WaitGroup) { for c := range ch { pool <- struct{}{} <-pool go handler(c, wg) }}//具体生产逻辑func handler(c int, wg *sync.WaitGroup) { defer wg.Done() fmt.Println("工作", c, "生产结束")}
- producer是生产者,外面批量生产业务数据,放到一个有缓冲管道里
- consumer是消费者,起多个协程生产管道里的数据,而协程的数量天然须要管制,怎么管制呢?通过pool这个有缓冲管道,机制就是每生产一条数据就往pool里发送一条数据,生产完读出,这样同时最多有50个工作同时在解决,超过则会阻塞期待其余协程处理完毕。
- wg用来期待子协程处理完毕
这种模型的劣势在于利用简略、容易管制,goroutine自身很轻便,仅损耗极少许的内存空间和调度,在解决数据量级不大、业务逻辑不太简单的状况利用是足够的,然而数据量级在几百万、几千万的时候还是这样频繁的创立goroutine,会节约大量调度goroutine和内存空间。
如果谋求更高的性能能够考虑一下第三方库,像panjf2000/ants的协程池就很成熟,前面有空的话会剖析一下它是如何实现的。