Java 記憶體模型的基礎(二)——重排序
一、資料依賴性
如果兩個操作訪問同一個變數,且兩個操作中有一個為寫操作,此時這兩個操作就存在資料依賴性。資料依賴分為以下三種情況:
名稱 | 程式碼示例 | 說 明 |
寫後讀 | a = 1; b = 2; |
寫一個變數後,再讀這個位置 |
寫後寫 | a = 1; a = 2; |
寫一個變數後,再寫這個變數 |
讀後寫 | a = b; b = 1; |
讀一個變數之後,再寫這個變數 |
上述三種情況,只要重排序兩個操作的執行順序,程式的執行結果就會改變
這裡說的資料依賴性僅針對單個處理器中執行的指令序列和單個執行緒中執行的操作,不同處理器和不同執行緒之間的資料依賴性不會被編譯器和處理器考慮。
二、as-if-serial語義
as-if-serial語義的意思是:不管怎麼重排序(編譯器和處理器為了提高並行度),(單執行緒)程式的執行結果不能被改編。編譯器、runtime和處理器都必須遵循as-if-serial語義。
為了遵循as-if-serial 語義,編譯器和處理器不會對存在資料依賴的操作重排序,因為這種重排序會改變執行結果。但是如果操作之間不存在資料依賴關係,這些操作就可能被編譯器和處理器重排序。
例如:
double pi = 3.14; //A
double r = 1.0; //B
double area = pi *r*r; //C
A和C之間存在資料依賴關係,同時B和C之間也存在資料以來關係。因此再最終執行的指令序列中,C不會被重排列到A和B的前面。但是A和B之間沒有依賴關係,因此編譯器和處理器可以重排序A和B之間的執行順序。
as-if-serial語義把單執行緒程式保護了起來,遵守 as-if-serial語義的編譯器、runtime和處理器共同為編寫單執行緒程式的程式設計師建立了一個幻覺:單執行緒程式是按程式的順序來執行的。as-if-serial 語義使單執行緒程式設計師無序擔心重排序會干擾他們,也無需擔心記憶體可見性問題。
三、程式順序規則
根據happens -before的程式順序規則,上面的計算圓的面積的示例嗲秒存在三個關係:
1、A happens- before B
2、B happens- before C
3、A happens- before C
這裡A happens- before B,但是實際執行時B卻可以排在A前邊。即如果A happens- before B,JMM並不一定要求A要在B之前執行。JMM僅要求前一個操作對後一個操作可見,且前一個操作按照順序排在第二個操作之前。這裡A的執行結果不需要對B可見,因此A和B可以進行重排序。這種情況下,JMM會認為這種重排序不非法,JMM允許這種重排序。
在計算機中,軟體技術和硬體技術有一個共同的目標:在不改變程式執行結果的前提下,儘量提高並行度。
四、重排序對多執行緒的影響
先看下面這段程式碼:假設有執行緒A先給a賦值,然後執行緒B在計算i的值
package test1;
public class Test implements Runnable{
private static int a;
private static boolean flag;
private int f;
public Test(int f1) {
// TODO Auto-generated constructor stub
this.f = f1;
}
@Override
public void run() {
// TODO Auto-generated method stub
if(f == 1){
a = 1;
flag = true;
}
if(f == -1){
int i = 0;
if(flag)
i = a*a;
System.out.println(i);
}
}
public static void main(String[] args) {
Test tt = new Test(1);
Test tt1 = new Test(-1);
Thread t1 = new Thread(tt);
Thread t2 = new Thread(tt1);
t1.start();
t2.start();
}
}
結果:一會是1一會是0
執行過程如下圖:
如上圖所示,操作1和操作2做了重排序,線上程B線上程A寫入a之前進行了的讀取,因此讀取的值為0,因此結果一會是0一會是1,因此多執行緒的語義被重排序破壞了!!!!
在程式中,操作3和操作4存在控制依賴關係。當代碼中存在控制依賴時,會影響指令序列的並行度。為此,編譯器會採用一種猜測執行來客服控制依賴對並行度的影響。拿上述例項說,處理器可以提前執行執行緒B讀取a並計算a*a,然後把計算結果臨時儲存到一個名為衝排列緩衝區的硬體快取中(這裡是為了節省匯流排IO)。當操作3的判斷條件為真時,將值寫入變數中。如下圖所示:
由此得出結論,在單執行緒中,對於存在控制依賴的操作做重排序,不會改變程式的執行結果;但是多執行緒,對存在控制依賴的操作做重排序,可能會改變程式的執行結果!!!!!