Java 使用 happen-before 規則實現共享變量的同步操作
前言
熟悉 Java 並發編程的都知道,JMM(Java 內存模型) 中的 happen-before(簡稱 hb)規則,該規則定義了 Java 多線程操作的有序性和可見性,防止了編譯器重排序對程序結果的影響。
按照官方的說法:
當一個變量被多個線程讀取並且至少被一個線程寫入時,如果讀操作和寫操作沒有 HB 關系,則會產生數據競爭問題。
要想保證
操作 B
的線程看到操作 A
的結果(無論A
和B
是否在一個線程),那麽在A
和B
之間必須滿足 HB 原則,如果沒有,將有可能導致重排序。
當缺少 HB 關系時,就可能出現重排序問題。
HB 有哪些規則?
這個大家都非常熟悉了應該,大部分書籍和文章都會介紹,這裏稍微回顧一下:
- 程序次序規則:一個線程內,按照代碼順序,書寫在前面的操作先行發生於書寫在後面的操作;
- 鎖定規則:在監視器鎖上的解鎖操作必須在同一個監視器上的加鎖操作之前執行。
- volatile變量規則:對一個變量的寫操作先行發生於後面對這個變量的讀操作;
- 傳遞規則:如果操作A先行發生於操作B,而操作B又先行發生於操作C,則可以得出操作A先行發生於操作C;
- 線程啟動規則:Thread對象的start()方法先行發生於此線程的每一個動作;
- 線程中斷規則:對線程interrupt()方法的調用先行發生於被中斷線程的代碼檢測到中斷事件的發生;
- 線程終結規則:線程中所有的操作都先行發生於線程的終止檢測,我們可以通過Thread.join()方法結束、Thread.isAlive()的返回值手段檢測到線程已經終止執行;
- 對象終結規則:一個對象的初始化完成先行發生於他的finalize()方法的開始;
其中,傳遞規則我加粗了,這個規則至關重要。如何熟練的使用傳遞規則是實現同步的關鍵。
然後,再換個角度解釋 HB:當一個操作 A HB 操作 B,那麽,操作 A 對共享變量的操作結果對操作 B 都是可見的。
同時,如果 操作 B HB 操作 C,那麽,操作 A 對共享變量的操作結果對操作 B 都是可見的。
而實現可見性的原理則是 cache protocol 和 memory barrier。通過緩存一致性協議和內存屏障實現可見性。
如何實現同步?
在 Doug Lea 著作 《Java Concurrency in Practice》中,有下面的描述:
書中提到:通過組合 hb 的一些規則,可以實現對某個未被鎖保護變量的可見性。
但由於這個技術對語句的順序很敏感,因此容易出錯。
樓主接下來,將演示如何通過 volatile 規則和程序次序規則實現對一個變量同步。
來一個熟悉的例子:
class ThreadPrintDemo {
static int num = 0;
static volatile boolean flag = false;
public static void main(String[] args) {
Thread t1 = new Thread(() -> {
for (; 100 > num; ) {
if (!flag && (num == 0 || ++num % 2 == 0)) {
System.out.println(num);
flag = true;
}
}
}
);
Thread t2 = new Thread(() -> {
for (; 100 > num; ) {
if (flag && (++num % 2 != 0)) {
System.out.println(num);
flag = false;
}
}
}
);
t1.start();
t2.start();
}
}
這段代碼的作用是兩個線程間隔打印出 0 - 100 的數字。
熟悉並發編程的同學肯定要說了,這個 num 變量沒有使用 volatile,會有可見性問題,即:t1 線程更新了 num,t2 線程無法感知。
哈哈,樓主剛開始也是這麽認為的,但最近通過研究 HB 規則,我發現,去掉 num 的 volatile 修飾也是可以的。
我們分析一下,樓主畫了一個圖:
我們分析這個圖:
- 首先,紅色和黃色表示不同的線程操作。
- 紅色線程對 num 變量做 ++,然後修改了 volatile 變量,這個是符合
程序次序規則的
。也就是 1 HB 2. - 紅色線程對 volatile 的寫 HB 黃色線程對 volatile 的讀,也就是 2 HB 3.
- 黃色線程讀取 volatile 變量,然後對 num 變量做 ++,符合
程序次序規則
,也就是 3 HB 4. - 根據
傳遞性規則
,1 肯定 HB 4. 所以,1 的修改對 4來說都是可見的。
註意:HB 規則保證上一個操作的結果對下一個操作都是可見的。
所以,上面的小程序中,線程 A 對 num 的修改,線程 B 是完全感知的 —— 即使 num 沒有使用 volatile 修飾。
這樣,我們就借助 HB 原則實現了對一個變量的同步操作,也就是在多線程環境中,保證了並發修改共享變量的安全性。並且沒有對這個變量使用 Java 的原語:volatile 和 synchronized 和 CAS(假設算的話)。
這可能看起來不安全(實際上安全),也好像不太容易理解。因為這一切都是 HB 底層的 cache protocol 和 memory barrier 實現的。
其他規則實現同步
- 利用線程終結規則實現:
static int a = 1;
public static void main(String[] args) {
Thread tb = new Thread(() -> {
a = 2;
});
Thread ta = new Thread(() -> {
try {
tb.join();
} catch (InterruptedException e) {
//NO
}
System.out.println(a);
});
ta.start();
tb.start();
}
- 利用線程 start 規則實現:
static int a = 1;
public static void main(String[] args) {
Thread tb = new Thread(() -> {
System.out.println(a);
});
Thread ta = new Thread(() -> {
tb.start();
a = 2;
});
ta.start();
}
這兩個操作,也可以保證變量 a 的可見性。
確實有點顛覆之前的觀念。之前的觀念中,如果一個變量沒有被 volatile 修飾或 final 修飾,那麽他在多線程下的讀寫肯定是不安全的 —— 因為會有緩存,導致讀取到的不是最新的。
然而,通過借助 HB,我們可以實現。
總結
雖然本文標題是通過 happen-before 實現對共享變量的同步操作,但主要目的還是更深刻的理解 happen-before,理解他的 happen-before 概念其實就是保證多線程環境中,上一個操作對下一個操作的有序性和操作結果的可見性。
同時,通過靈活的使用傳遞性規則,再對規則進行組合,就可以將兩個線程進行同步 —— 實現指定的共享變量不使用原語也可以保證可見性。雖然這好像不是很易讀,但也是一種嘗試。
關於如何組合使用規則實現同步,Doug Lea 在 JUC 中給出了實踐。
例如老版本的 FutureTask 的內部類 Sync(已消失),通過 tryReleaseShared 方法修改 volatile 變量,tryAcquireShared 讀取 volatile 變量,這是利用了 volatile 規則;
通過在 tryReleaseShared 之前設置非 volatile 的 result 變量,然後在 tryAcquireShared 之後讀取 result 變量,這是利用了程序次序規則。
從而保證 result 變量的可見性。和我們的第一個例子類似:利用程序次序規則和 volatile 規則實現普通變量可見性。
而 Doug Lea 自己也說了,這個“借助”技術非常容易出錯,要謹慎使用。但在某些情況下,這種“借助”是非常合理的。
實際上,BlockingQueue 也是“借助”了 happen-before 的規則。還記得 unlock 規則嗎?當 unlock 發生後,內部元素一定是可見的。
而類庫中還有其他的操作也“借助”了 happen-before 原則:並發容器,CountDownLatch,Semaphore,Future,Executor,CyclicBarrier,Exchanger 等。
總而言之,言而總之:
happen-before 原則是 JMM 的核心所在,只有滿足了 hb 原則才能保證有序性和可見性,否則編譯器將會對代碼重排序。hb 甚至將 lock 和 volatile 也定義了規則。
通過適當的對 hb 規則的組合,可以實現對普通共享變量的正確使用。
Java 使用 happen-before 規則實現共享變量的同步操作