深入理解並發/並行,阻塞/非阻塞,同步/異步【轉】
1、阻塞,非阻塞
首先,阻塞這個詞來自操作系統的線程/進程的狀態模型中,如下圖:
一個線程/進程經歷的5個狀態,創建,就緒,運行,阻塞,終止。各個狀態的轉換條件如上圖,其中有個阻塞狀態,就是說當線程中調用某個函數,需要IO請求,或者暫時得不到競爭資源的,操作系統會把該線程阻塞起來,避免浪費CPU資源,等到得到了資源,再變成就緒狀態,等待CPU調度運行。
1.1、阻塞調用
阻塞調用是指調用結果返回之前,調用者會進入阻塞狀態等待。只有在得到結果之後才會返回。
阻塞調用:比如 socket 的 recv(),調用這個函數的線程如果沒有數據返回,它會一直阻塞著,也就是 recv() 後面的代碼都不會執行了,程序就停在 recv() 這裏等待,所以一般把 recv() 放在單獨的線程裏調用。
1、2、非阻塞調用
非阻塞調用是指在不能立刻得到結果之前,該函數不會阻塞當前線程,而會立刻返回。
非阻塞調用:比如非阻塞socket 的 send(),調用這個函數,它只是把待發送的數據復制到TCP輸出緩沖區中,就立刻返回了,線程並不會阻塞,數據有沒有發出去 send() 是不知道的,不會等待它發出去才返回的。
擴展:
如果線程始終阻塞著,永遠得不到資源,於是就發生了死鎖。
比如A線程要X,Y資源才能繼續運行,B線程也要X,Y資源才能運行,但X,Y同時只能給一個線程用(即互斥條件)用的時候其他線程又不能搶奪。
A 有 X,等待 Y。
B 有 Y,等待 X。
於是A,B發生了循環等待,造成死鎖。給用戶的感覺就是程序卡著不動了。
在寫代碼的時候要特別註意共享資源的使用,用信號量控制好,避免造成死鎖。死鎖的解除有個著名的銀行家算法
阻塞和掛起:阻塞是被動的,比如搶不到資源。掛起是主動的,線程自己調用 suspend() 把自己退出運行態了,某些時候調用 resume() 又恢復運行。
線程執行完就會被銷毀,如果不想線程被頻繁的創建,銷毀,怎麽辦?可以給線程裏面寫個死循環,或者讓線程有任務的時候執行,沒任務的時候掛起,就像iOS中的 runloop 機制一樣。線程就不會隨便的終止了。
2、異步、同步
2、1、異步
同步:在發出一個同步調用時,在沒有得到結果之前,該調用就不返回。
例子:
int n = func(); next(); // func() 的結果沒有返回,next() 就不會執行,直到 func() 運行完。
同步的定義看起來跟阻塞很像,但是同步跟阻塞是兩個概念,同步調用的時候,線程不一定阻塞,調用雖然沒返回,但它還是在運行狀態中的,CPU很可能還在執行這段代碼,而阻塞的話,它就肯定不在CPU中跑這個代碼了。這就是同步和阻塞的區別。同步是肯定可以在,阻塞是肯定不在。
2.2、異步
異步:在發出一個異步調用後,調用者不會立刻得到結果,該調用就返回了
例子:
func(callback); next(); ... void callback(int n) // func 結果回調 { int k = n; } // func() 執行後,還沒得出結果就立即返回,然後執行 next() 了 // 等到結果出來,func() 回調 callback() 通知調用者結果。
異步和非阻塞的定義比較像,兩者的區別是異步是說調用的時候結果不會馬上返回,線程可能被阻塞起來,也可能不阻塞,兩者沒關系。非阻塞是說調用的時候,線程肯定不會進入阻塞狀態。
上面兩組概念,就有4種組合。
同步阻塞調用:得不到結果不返回,線程進入阻塞態等待。
同步非阻塞調用:得不到結果不返回,線程不阻塞一直在CPU運行。
異步阻塞調用:去到別的線程,讓別的線程阻塞起來等待結果,自己不阻塞。
異步非阻塞調用:去到別的線程,別的線程一直在運行,直到得出結果。
3、並發、並行
3、1、並發
並發是指一個時間段內,有幾個程序都在同一個CPU上運行,但任意一個時刻點上只有一個程序在處理機上運行。
3.2、並行
並行是指一個時間段內,有幾個程序都在幾個CPU上運行,任意一個時刻點上,有多個程序在同時運行,並且多道程序之間互不幹擾。
並發和並行的區別:
並行是多個程序在多個CPU上同時運行,任意一個時刻可以有很多個程序同時運行,互不幹擾。
並發是多個程序在一個CPU上運行,CPU在多個程序之間快速切換,微觀上不是同時運行,任意一個時刻只有一個程序在運行,但宏觀上看起來就像多個程序同時運行一樣,因為CPU切換速度非常快,時間片是64ms(每64ms切換一次,不同的操作系統有不同的時間),人類的反應速度是100ms,你還沒反應過來,CPU已經切換了好幾個程序了。
切換耗時:線程用完了時間片,釋放CPU控制權,引發系統中斷,調度程序根據相關策略選取下一個線程來運行,這裏需要一點耗時。
舉個例子吧,並行就是,多個人,有人在掃地,有人在做飯,有人在洗衣服,掃地,做飯,洗衣服都是同時進行的。
並發就是,有一個人,這個人一會兒掃地,一會兒做飯,一會兒洗衣服,他在這3件事中來回做,同一時刻只做一件事,不是同時做的,但最後3件事都可以做完。
時間片大小的選取
時間片取的小,假設是20ms,切換耗時假設是 10ms。
那麽用戶感覺不到多個程序之間會卡,響應很快,因為切換太快了,但是CPU的利用率就低了,20 / (20 + 10) = 66% 只有這麽多,33%都浪費了。
時間片取的大,假設是200ms,切換耗時是 10ms
那麽用戶會覺得程序卡,響應慢,因為要200ms後才輪到我的程序運行,但是CPU利用率就高了,200 / (200 + 10) = 95% 有這麽多被利用的。
所以時間片取太大或者太小都不好,一般在 10 - 100 ms 之間。
3.3、CPU調度策略
在並發運行中,CPU需要在多個程序之間來回切換,那麽如何切換就有一些策略
#先來先服務 - 時間片輪轉調度
這個很簡單,就是誰先來,就給誰分配時間片運行,缺點是有些緊急的任務要很久才能得到運行。
# 優先級調度
每個線程有一個優先級,CPU每次去拿優先級高的運行,優先級低的等等,為了避免優先級低的等太久,每等一定時間,就給優先級低的線程提高一個級別
# 最短作業優先
把線程任務量排序,每次拿處理時間短的線程運行,就像我去銀行辦業務一樣,我的事情很快就處理完了,所以讓我插隊先辦完,後面時間長的人先等等,時間長的人就很難得到響應了。
# 最高響應比優先
用線程的等待時間除以服務時間,得到響應比,響應比小的優先運行。這樣不會造成某些任務一直得不到響應。
#多級反饋隊列調度
有多個優先級不同的隊列,每個隊列裏面有多個等待線程。
CPU每次從優先級高的遍歷到低的,取隊首的線程運行,運行完了放回隊尾,優先級越高,時間片越短,即響應越快,時間片大小就不是固定的了。
每個隊列的內部還是用先來先服務的策略。
深入理解並發/並行,阻塞/非阻塞,同步/異步【轉】