Golang語言併發技術詳解
有人把Go比作21世紀的C語言,第一是因為Go語言設計簡單,第二,21世紀最重要的就是並行程式設計,而Go從語言層面就支援了並行。
goroutine
goroutine是Go並行設計的核心。goroutine說到底其實就是執行緒,但是它比執行緒更小,十幾個goroutine可能體現在底層就是五六個執行緒,Go語言內部幫你實現了這些goroutine之間的記憶體共享。執行goroutine只需極少的棧記憶體(大概是4~5KB),當然會根據相應的資料伸縮。也正因為如此,可同時執行成千上萬個併發任務。goroutine比thread更易用、更高效、更輕便。
goroutine是通過Go的runtime管理的一個執行緒管理器。goroutine通過go關鍵字實現了,其實就是一個普通的函式。
go hello(a, b, c)
通過關鍵字go就啟動了一個goroutine。我們來看一個例子
package main import ( "fmt" "runtime" ) func say(s string) { for i := 0; i < 5; i++ { runtime.Gosched() fmt.Println(s) } } func main() { go say("world") //開一個新的Goroutines執行 say("hello") //當前Goroutines執行 } // 以上程式執行後將輸出: // hello // world // hello // world // hello // world // hello // world // hello
我們可以看到go關鍵字很方便的就實現了併發程式設計。 上面的多個goroutine執行在同一個程序裡面,共享記憶體資料,不過設計上我們要遵循:不要通過共享來通訊,而要通過通訊來共享。
runtime.Gosched()表示讓CPU把時間片讓給別人,下次某個時候繼續恢復執行該goroutine。
預設情況下,排程器僅使用單執行緒,也就是說只實現了併發。想要發揮多核處理器的並行,需要在我們的程式中顯式呼叫 runtime.GOMAXPROCS(n) 告訴排程器同時使用多個執行緒。GOMAXPROCS 設定了同時執行邏輯程式碼的系統執行緒的最大數量,並返回之前的設定。如果n < 1,不會改變當前設定。以後Go的新版本中排程得到改進後,這將被移除。這裡有一篇Rob介紹的關於併發和並行的文章:
channels
goroutine執行在相同的地址空間,因此訪問共享記憶體必須做好同步。那麼goroutine之間如何進行資料的通訊呢,Go提供了一個很好的通訊機制channel。channel可以與Unix shell 中的雙向管道做類比:可以通過它傳送或者接收值。這些值只能是特定的型別:channel型別。定義一個channel時,也需要定義傳送到channel的值的型別。注意,必須使用make 建立channel:
ci := make(chan int)
cs := make(chan string)
cf := make(chan interface{})
channel通過操作符<-來接收和傳送資料
ch <- v // 傳送v到channel ch.
v := <-ch // 從ch中接收資料,並賦值給v
我們把這些應用到我們的例子中來:
package main
import "fmt"
func sum(a []int, c chan int) {
total := 0
for _, v := range a {
total += v
}
c <- total // send total to c
}
func main() {
a := []int{7, 2, 8, -9, 4, 0}
c := make(chan int)
go sum(a[:len(a)/2], c)
go sum(a[len(a)/2:], c)
x, y := <-c, <-c // receive from c
fmt.Println(x, y, x + y)
}
預設情況下,channel接收和傳送資料都是阻塞的,除非另一端已經準備好,這樣就使得Goroutines同步變的更加的簡單,而不需要顯式的lock。所謂阻塞,也就是如果讀取(value := <-ch)它將會被阻塞,直到有資料接收。其次,任何傳送(ch<-5)將會被阻塞,直到資料被讀出。無緩衝channel是在多個goroutine之間同步很棒的工具。
Buffered Channels
上面我們介紹了預設的非快取型別的channel,不過Go也允許指定channel的緩衝大小,很簡單,就是channel可以儲存多少元素。ch:= make(chan bool, 4),建立了可以儲存4個元素的bool 型channel。在這個channel 中,前4個元素可以無阻塞的寫入。當寫入第5個元素時,程式碼將會阻塞,直到其他goroutine從channel 中讀取一些元素,騰出空間。
ch := make(chan type, value)
value == 0 ! 無緩衝(阻塞)
value > 0 ! 緩衝(非阻塞,直到value 個元素)
我們看一下下面這個例子,你可以在自己本機測試一下,修改相應的value值
package main
import "fmt"
func main() {
c := make(chan int, 2)//修改2為1就報錯,修改2為3可以正常執行
c <- 1
c <- 2
fmt.Println(<-c)
fmt.Println(<-c)
}
Range和Close
上面這個例子中,我們需要讀取兩次c,這樣不是很方便,Go考慮到了這一點,所以也可以通過range,像操作slice或者map一樣操作快取型別的channel,請看下面的例子
package main
import (
"fmt"
)
func fibonacci(n int, c chan int) {
x, y := 1, 1
for i := 0; i < n; i++ {
c <- x
x, y = y, x + y
}
close(c)
}
func main() {
c := make(chan int, 10)
go fibonacci(cap(c), c)
for i := range c {
fmt.Println(i)
}
}
for i := range c能夠不斷的讀取channel裡面的資料,直到該channel被顯式的關閉。上面程式碼我們看到可以顯式的關閉channel,生產者通過內建函式close關閉channel。關閉channel之後就無法再發送任何資料了,在消費方可以通過語法v, ok := <-ch測試channel是否被關閉。如果ok返回false,那麼說明channel已經沒有任何資料並且已經被關閉。
記住應該在生產者的地方關閉channel,而不是消費的地方去關閉它,這樣容易引起panic
另外記住一點的就是channel不像檔案之類的,不需要經常去關閉,只有當你確實沒有任何傳送資料了,或者你想顯式的結束range迴圈之類的。
Select
我們上面介紹的都是隻有一個channel的情況,那麼如果存在多個channel的時候,我們該如何操作呢,Go裡面提供了一個關鍵字select,通過select可以監聽channel上的資料流動。
select預設是阻塞的,只有當監聽的channel中有傳送或接收可以進行時才會執行,當多個channel都準備好的時候,select是隨機的選擇一個執行的。
package main
import "fmt"
func fibonacci(c, quit chan int) {
x, y := 1, 1
for {
select {
case c <- x:
x, y = y, x + y
case <-quit:
fmt.Println("quit")
return
}
}
}
func main() {
c := make(chan int)
quit := make(chan int)
go func() {
for i := 0; i < 10; i++ {
fmt.Println(<-c)
}
quit <- 0
}()
fibonacci(c, quit)
}
在select裡面還有default語法,select其實就是類似switch的功能,default就是當監聽的channel都沒有準備好的時候,預設執行的(select不再阻塞等待channel)。
select {
case i := <-c:
// use i
default:
// 當c阻塞的時候執行這裡
}
超時
有時候會出現goroutine阻塞的情況,那麼我們如何避免整個程式進入阻塞的情況呢?我們可以利用select來設定超時,通過如下的方式實現:
func main() {
c := make(chan int)
o := make(chan bool)
go func() {
for {
select {
case v := <- c:
println(v)
case <- time.After(5 * time.Second):
println("timeout")
o <- true
break
}
}
}()
<- o
}
runtime goroutine
runtime包中有幾個處理goroutine的函式:
Goexit
退出當前執行的goroutine,但是defer函式還會繼續呼叫
Gosched
讓出當前goroutine的執行許可權,排程器安排其他等待的任務執行,並在下次某個時候從該位置恢復執行。
NumCPU
返回 CPU 核數量
NumGoroutine
返回正在執行和排隊的任務總數
GOMAXPROCS
用來設定可以平行計算的CPU核數的最大值,並返回之前的值。