java併發程式設計 --併發問題的根源及主要解決方法
阿新 • • 發佈:2020-06-17
[toc]
# 併發問題的根源在哪
首先,我們要知道併發要解決的是什麼問題?併發要解決的是單程序情況下硬體資源無法充分利用的問題。而造成這一問題的主要原因是CPU-記憶體-磁碟三者之間速度差異實在太大。如果將CPU的速度比作火箭的速度,那麼記憶體的速度就像火車,而最慘的磁碟,基本上就相當於人雙腿走路。
這樣造成的一個問題,就是CPU快速執行完它的任務的時候,很長時間都會在等待磁碟或是記憶體的讀寫。
計算機的發展有一部分就是如何重複利用資源,解決硬體資源之間效率的不平衡,而後就有了多程序,多執行緒的發展。並且演化出了各種為多程序(執行緒)服務的東西:
- CPU增加快取機制,平衡與記憶體的速度差異
- 增加了多個概念,CPU時間片,程式計數器,執行緒切換等,用以更好得服務併發場景
- 編譯器的指令優化,希望在**內部**充分利用硬體資源
但是這樣一來,也會帶來新的併發問題,歸結起來主要有三個。
- 由於快取導致的可見性問題
- 執行緒切換帶來的原子性問題
- 編譯器優化帶來的有序性問題
我們分別介紹這幾個:
### 快取導致的可見性
CPU為了平衡與記憶體之間的效能差異,引入了CPU快取,這樣CPU執行指令修改資料的時候就可以批量直接讀寫CPU快取的記憶體,一個階段後再將資料寫回到記憶體。
但由於現在多核CPU技術的發展,各個執行緒可能執行在不同CPU核上面,每個CPU核各有各自的CPU快取。前面說到對變數的修改通常都會先寫入CPU快取,再寫回記憶體。這就會出現這樣一種情況,執行緒1修改了變數A,但此時修改後的變數A只儲存在CPU快取中。這時候執行緒B去記憶體中讀取變數A,依舊只讀取到舊的值,這就是可見性問題。
### 執行緒切換帶來的原子性
為了更充分得利用CPU,引入了CPU時間片時間片的概念。程序或執行緒通過爭用CPU時間片,讓CPU可以更加充分得利用。
比如在進行讀寫磁碟等耗時高的任務時,就可以將寶貴的CPU資源讓出來讓其他執行緒去獲取CPU並執行任務。
但這樣的切換也會導致問題,那就是會破壞執行緒某些任務的原子性。比如java中簡單的一條語句count += 1。
對映到CPU指令有三條,讀取count變數指令,變數加1指令,變數寫回指令。雖然在高階語言(java)看來它就是一條指令,但實際上確是三條CPU指令,並且這三條指令的原子性無法保證。也就是說,可能在執行到任意一條指令的時候被打斷,CPU被其他執行緒搶佔了。而這個期間變數值可能會被修改,這裡就會引發資料不一致的情況了。所以高併發場景下,很多時候都會通過鎖實現原子性。而這個問題也是很多併發問題的源頭。
### 編譯器優化帶來的有序性
因為現在程式設計師編寫的都是高階語言,編譯器需要將使用者的程式碼轉成CPU可以執行的指令。
同時,由於計算機領域的不斷髮展,編譯器也越來越智慧,它會自動對程式設計師編寫的程式碼進行優化,而優化中就有可能出現實際執行程式碼順序和編寫的程式碼順序不一樣的情況。
而這種破壞程式有序性的行為,在有些時候會出現一些非常微妙且難以察覺的併發程式設計bug。
舉個簡單的例子,我們常見的單例模式是這樣的:
```
public class Singleton {
private Singleton() {}
private static Singleton sInstance;
public static Singleton getInstance() {
if (sInstance == null) { //第一次驗證是否為null
synchronized (Singleton.class) { //加鎖
if (sInstance == null) { //第二次驗證是否為null
sInstance = new Singleton(); //建立物件
}
}
}
return sInstance;
}
}
```
即通過兩段判斷加鎖來保證單例的成功生成,但在極小的概率下,可能會出現異常情況。原因就出現在**sInstance = new Singleton()**;這一行程式碼上。這行程式碼,我們理解的執行順序應該是這樣:
1. 為Singleton象分配一個記憶體空間。
2. 在分配的記憶體空間例項化物件。
3. 把Instance 引用地址指向記憶體空間。
但在實際編譯的過程中,編譯器有可能會幫我們進行優化,優化完它的順序可能變成如下:
1. 為Singleton物件分配一個記憶體空間。
2. 把instance 引用地址指向記憶體空間。
3. 在分配的記憶體空間例項化物件。
按照優化完的順序,當併發訪問的時候,可能會出現這樣的情況
1. A執行緒進入方法進行第1次instance == null判斷。
2. 此時A執行緒發現instance 為null 所以對Singleton.class加鎖。
3. 然後A執行緒進入方法進行第2次instance == null判斷。
4. 然後A執行緒發現instance 為null,開始進行物件例項化。
5. 為物件分配一個記憶體空間。
6.把Instance 引用地址指向記憶體空間(而就在這個指令完成後,執行緒B進入了方法)。
7. B執行緒首先進入方法進行第1次instance == null判斷。
8. B執行緒此時發現instance 不為null ,所以它會直接返回instance (而此時返回的instance 是A執行緒還沒有初始化完成的物件)
最終執行緒B拿到的instance 是一個沒有例項化物件的空記憶體地址,所以導致instance使用的過程中造成程式錯誤。解決辦法很簡單,可以給sInstance物件加上一個關鍵字,volatile,這樣編譯器就不會亂優化,有關volatile的具體內容後續再細說。
# 主要解決辦法
通過上面的介紹,其實可以歸納無論是CPU快取,執行緒切換還是編譯器優化亂序,出現問題的核心都是因為多個執行緒要併發讀寫某個變數或併發執行某段程式碼。那麼我們可以控制,一次只讓一個執行緒執行變數讀寫就可以了,這就是**互斥**。
而在某些時候,互斥還不夠,還需要一定的條件。比如一個生產者一個消費者併發,生產者向佇列存東西,消費者向佇列拿東西。那麼生產者寫的時候要保證存的時候佇列不是滿的,消費者要保證拿的時候佇列非空。這種執行緒與執行緒間需要通訊協作的情況,稱為**同步**,**同步可以說是更復雜的互斥**。
既然知道了併發程式設計的根源以及同步和互斥,那我們來看看有哪些解決的思路。其實一共也就三種:
- 避免共享
- Immutability(不變性)
- 管程及其他工具
下面我們分別說說這三種方案的優缺點
### 避免共享
我們先來說說避免共享,其實避免共享說是執行緒本地儲存技術,在java中指的一般就是Threadlocal。ThreadLocal會為每個執行緒提供一個本地副本,每個執行緒都只會修改自己的ThreadLocal變數。這樣一來就不會出現共享變數,也就不會出現衝突了。
其實現原理是在ThreadLocal內部維護一個ThreadLocalMap,每次有執行緒要獲取對應變數的時候,先獲取當前執行緒,然後根據不同執行緒取不同的值,典型的以空間換時間。
所以ThreadLocal還是比較適用於需要共享資源,且資源佔用空間不大的情況。比如一些連線的session啊等等。但是這種模式應用場景也較為有限,比如需要同步情況就難以勝任。
### Immutability(不變性)
Immutability在函式式中用得比較多,函數語言程式設計的一個主要目的是要寫出無副作用的程式碼,有關什麼是無副作用可以參考我以前的文章[Scala函數語言程式設計指南(一) 函式式思想介紹](https://www.cnblogs.com/listenfwind/p/11209383.html)。而無副作用的一個主要特點就是變數都是Immutability即不可變的,即建立物件後不會再修改物件,比如scala預設的變數和資料結構都是不可變的。而在java中,不變性變數即通過final修飾的變數,如String,Long,Double等型別都是Immutability的,它們的內部實現都是基於final關鍵字的。
那這又和併發程式設計有什麼關係呢?其實啊,併發問題很大部分原因就是因為執行緒切換破壞了原子性,這又導致執行緒隨意對變數的讀寫破壞了資料的一致性。而不變性就不必擔心這個問題,因為變數都是不變,不可寫只能讀的。在這種程式設計模式下,你要修改一個變數,那麼只能新生成一個。這樣做的好處很明顯,但壞處也是顯而易見,那就是引入了額外的程式設計複雜度,喪失了程式碼的可讀性和易用性。
因為如此,不變性的併發解決方案其實相對而已沒那麼廣泛,其中比較有代表性的算是Actor併發程式設計模型,我以前也有討論過,有興趣可以看看[Actor模型淺析 一致性和隔離性](https://www.cnblogs.com/listenfwind/p/9963489.html),這種程式設計模型和常規併發解決方案有很顯著的差異。按我的瞭解,Acctor模式多用在分散式系統的一些協調功能,比如維持叢集中多個機器的心跳通訊等等。如果在單機併發環境下,還是下面要介紹的管程類工具才是利器。
### 管程及其他工具
其實最早的作業系統中,解決併發問題用的是訊號量,訊號量通過兩個原子操作wait(S),和signal(S)(俗稱P,V操作)來實現訪問資源互斥和同步。比如下面這個小例子:
```
//整型訊號量定義
int S;
//P操作
wait(S){
while(S<=0);
S--;
}
//V操作
signal(S){
S++;
}
```
雖然訊號量方便有效,但訊號量要對每個共享資源都實現對應的P和V操作,這使得併發程式設計中可能要出現大量的P,V操作,並且這部分內容難以抽象出來。
為了更好地實現同步互斥,於是就產生了管程(即Monitor,也有翻譯為監視器),值得一提的是,管程也有幾種模型,分別是:Hasen模型,Hoare模型和MESA模型。其中MESA模型應用最廣泛,java也是參考自MESA模型。這裡簡單介紹下管程的理論知識,這部分內容參考自[程序同步機制-----為程序併發執行保駕護航](https://blog.csdn.net/qq_34666857/article/details/102948786),希望瞭解更多管程理論知識的童鞋可以看看。
我們來通過一個經典的生產-消費佇列來解釋,如下圖
![管程介紹](https://img2020.cnblogs.com/blog/1011838/202004/1011838-20200427155319999-1253618940.jpg)
我們先解釋下圖中右半部分的內容,右上角有一個等待呼叫的執行緒佇列,管程中每次只能有一個執行緒在執行任務,所以多個任務需要等待。然後是各個名詞的意思,生產-消費需要往佇列寫入和取出東西,**這裡的佇列就是共享變數**,**對共享資源進行操作稱之為過程(入隊和出隊兩個過程)**。而向佇列寫入和取出是有條件的,寫入的時候佇列必須是非滿的,取出的時候佇列必須是非空的,**這兩個條件被稱為條件變數**。
然後再來看看左半部分的內容,假設執行緒T1讀取共享變數(即佇列),此時發現佇列為空(條件變數之一),那麼T1此時需要等待,去哪裡等呢?去條件變數**佇列不能為空**對應的佇列中去等待。此時另一個執行緒T2向共享變數佇列寫資料,通過了條件變數**佇列不能滿**,那麼寫完後就會通知執行緒T1。但因為管程的限制,管程中只能有一個執行緒在執行,所以T1執行緒不能立即執行,它會回到右上角的執行緒等待佇列等待(不同的管程模型在這裡是有分歧的,比如Hasen模型是立即中斷T2執行緒讓佇列中下一個執行緒執行)。
解釋完這個圖,管程的概念也就呼之欲出了,
> hansen對管程的定義如下:一個管程定義了一個數據結構和能力為併發程序所執行(在該資料結構上)的一組操作,這組操作能同步程序和改變管程中的資料。
本質上,管程是對共享資源以及對共享資源的操作抽象成變數和方法,要操作共享變數僅能通過管程提供的方法(比如上面的入隊和出隊)間接訪問。所以你會發現管程其實和麵向物件的理念是十分相近的,在java中,主要提供了低層次了synchronized關鍵字和wait(),notify()等方法。同時還提供了高層次的ReenTrantLock和Condition來實現管程模型。