1. 程式人生 > 實用技巧 >【Java併發005】原理層面:volatile關鍵字全解析

【Java併發005】原理層面:volatile關鍵字全解析

一、前言

在Java 5之前,volatile是一個備受爭議的關鍵字,因為在程式中使用它往往會導致出人意料的結果。
在Java 5之後,volatile關鍵字才得以重獲生機。

volatile關鍵字雖然從字面上理解起來比較簡單,但是要用好不是一件容易的事情。由於volatile關鍵字是與JMM(Java記憶體模型)有關的,因此在講述volatile關鍵之前,我們先來了解一下與記憶體模型相關的概念和知識,然後分析了volatile關鍵字的實現原理,最後給出了幾個使用volatile關鍵字的場景。

二、硬體層面解決快取不一致的兩種方法(總線上加lock鎖+快取一致性協議)

2.1 造成問題:快取不一致

因為CPU和記憶體速度的剪刀差引入快取記憶體:計算機在執行程式時,每條指令都是在CPU中執行的,而執行指令過程中,勢必涉及到資料的讀取和寫入。由於程式執行過程中的臨時資料是存放在主存(實體記憶體)當中的,這時就存在一個問題,由於CPU執行速度很快,而從記憶體讀取資料和向記憶體寫入資料的過程跟CPU執行指令的速度比起來要慢的多,因此如果任何時候對資料的操作都要通過和記憶體的互動來進行,會大大降低指令執行的速度。因此在CPU裡面就有了快取記憶體。

當程式在執行過程中,會將運算需要的資料從主存複製一份到CPU的快取記憶體當中,那麼CPU進行計算時就可以直接從它的快取記憶體讀取資料和向其中寫入資料,當運算結束之後,再將快取記憶體中的資料重新整理到主存當中。舉個簡單的例子,比如下面的這段程式碼:

i = i + 1;

步驟1:從主存當中讀取i的值,然後複製一份到快取記憶體當中;
步驟2:CPU執行指令對i進行加1操作;
步驟3:將資料寫入快取記憶體,最後將快取記憶體中i最新的值重新整理到主存當中。

這個程式碼在單執行緒中執行是沒有任何問題的,但是在多執行緒中執行就會有問題了。在多核CPU中,每條執行緒可能運行於不同的CPU中,因此每個執行緒執行時有自己的快取記憶體(對單核CPU來說,其實也會出現這種問題,只不過是以執行緒排程的形式來分別執行的)。本文我們以多核CPU為例。

比如同時有2個執行緒執行這段程式碼,假如初始時i的值為0,那麼我們希望兩個執行緒執行完之後i的值變為2。但是事實會是這樣嗎?

可能存在下面一種情況:初始時,兩個執行緒分別讀取i的值存入各自所在的CPU的快取記憶體當中,然後執行緒1進行加1操作,然後把i的最新值1寫入到記憶體。此時執行緒2的快取記憶體當中i的值還是0,進行加1操作之後,i的值為1,然後執行緒2把i的值寫入記憶體。

最終結果i的值是1,而不是2。這就是著名的快取一致性問題。通常稱這種被多個執行緒訪問的變數為共享變數。

也就是說,如果一個變數在多個CPU中都存在快取(一般在多執行緒程式設計時才會出現),那麼就可能存在快取不一致的問題。

2.2 解決方式:匯流排鎖 + 快取一致性

為了解決快取不一致性問題,通常來說有以下2種解決方法:

(1)通過在匯流排加LOCK#鎖的方式
(2)通過快取一致性協議

這2種方式都是硬體層面上提供的方式。

2.2.1 匯流排鎖,通過對匯流排加鎖原子化這個

因為CPU和其他部件進行通訊都是通過匯流排來進行的,如果對匯流排加LOCK#鎖的話,也就是說阻塞了其他CPU對其他部件訪問(如記憶體),從而使得只能有一個CPU能使用這個變數的記憶體。

整個流程:

  1. 寫操作:當一個CPU在執行 i = i +1,如果在執行這段程式碼的過程中,在總線上發出了LCOK#鎖的訊號,不允許其他CPU操作,只有等該CPU執行完成這段程式碼之後,匯流排鎖消失;
  2. 讀操作:當其他CPU才能從變數i所在的記憶體讀取變數,然後進行相應的操作,這樣就解決了快取不一致的問題。

關鍵:通過鎖住匯流排,使該CPU原子化讀寫記憶體的操作,其他CPU無法打斷。

缺點:由於在鎖住匯流排期間,其他CPU無法訪問記憶體,導致效率低下。

2.2.2 快取一致性協議,通過快取失效使其他CPU強制從主存中讀取

所以就出現了快取一致性協議。最出名的就是Intel 的MESI協議,MESI協議保證了每個快取中使用的共享變數的副本是一致的。它核心的思想是:

  1. 寫操作:當CPU寫資料時,如果發現操作的變數是共享變數,即在其他CPU中也存在該變數的副本,會發出訊號通知其他CPU將該變數的快取行置為無效狀態;
  2. 讀操作:當其他CPU需要讀取剛剛寫入的這個變數時,發現自己快取中快取該變數的快取行是無效的,那麼它就會從記憶體重新讀取。

三、併發程式設計中的三個概念

在併發程式設計中,我們通常會遇到以下三個問題:原子性問題,可見性問題,有序性問題。我們先看具體看一下這三個概念:

3.1 原子性

3.1.1 原子性定義

原子性定義:即一個操作或者多個操作 要麼全部執行並且執行的過程不會被任何因素打斷,要麼就都不執行。

3.1.2 原子性舉例

原子性舉例:

併發程式設計中,假如為一個32位的變數賦值過程不具備原子性的話,會發生什麼後果?

i = 9;

假若一個執行緒執行到這個語句時,我暫且假設為一個32位的變數賦值包括兩個過程:為低16位賦值,為高16位賦值。

那麼就可能發生一種情況:當將低16位數值寫入之後,突然被中斷,而此時又有一個執行緒去讀取i的值,那麼讀取到的就是錯誤的資料。

3.2 可見性

3.2.1 可見性定義

可見性定義:當多個執行緒訪問同一個變數時,一個執行緒修改了這個變數的值,其他執行緒能夠立即看得到修改的值。

3.2.2 可見性舉例

舉個簡單的例子,看下面這段程式碼:

//執行緒1執行的程式碼
int i = 0;
i = 10;
 
//執行緒2執行的程式碼
j = i;

假若執行執行緒1的是CPU1,執行執行緒2的是CPU2。由上面的分析可知,當執行緒1執行 i =10這句時,會先把i的初始值載入到CPU1的快取記憶體中,然後賦值為10,那麼在CPU1的快取記憶體當中i的值變為10了,卻沒有立即寫入到主存當中。

此時執行緒2執行 j = i,它會先去主存讀取i的值並載入到CPU2的快取當中,注意此時記憶體當中i的值還是0,那麼就會使得j的值為0,而不是10.

這就是可見性問題,執行緒1對變數i修改了之後,執行緒2沒有立即看到執行緒1修改的值。

3.3 有序性

3.3.1 有序性定義

有序性定義:即程式執行的順序按照程式碼的先後順序執行。

3.3.2 有序性舉例(單執行緒下指令重排不會造成執行緒安全問題)

舉個簡單的例子,看下面這段程式碼:

int i = 0;              
boolean flag = false;
i = 1;                //語句1  
flag = true;          //語句2

上面程式碼定義了一個int型變數,定義了一個boolean型別變數,然後分別對兩個變數進行賦值操作。從程式碼順序上看,語句1是在語句2前面的,那麼JVM在真正執行這段程式碼的時候會保證語句1一定會在語句2前面執行嗎?不一定,為什麼呢?這裡可能會發生指令重排序(Instruction Reorder)。

下面解釋一下什麼是指令重排序,一般來說,處理器為了提高程式執行效率,可能會對輸入程式碼進行優化,它不保證程式中各個語句的執行先後順序同程式碼中的順序一致,但是它會保證程式最終執行結果和程式碼順序執行的結果是一致的。

比如上面的程式碼中,語句1和語句2誰先執行對最終的程式結果並沒有影響,那麼就有可能在執行過程中,語句2先執行而語句1後執行。

但是要注意,雖然處理器會對指令進行重排序,但是它會保證程式最終結果會和程式碼順序執行結果相同,那麼它靠什麼保證的呢?再看下面一個例子:

int a = 10;    //語句1
int r = 2;    //語句2
a = a + 3;    //語句3
r = a*a;     //語句4

這段程式碼有4個語句,那麼可能的一個執行順序是:語句2 語句1 語句3 語句4

問題:那麼可不可能是這個執行順序呢: 語句2 語句1 語句4 語句3
回答:不可能,因為處理器在進行重排序時是會考慮指令之間的資料依賴性,如果一個指令Instruction 2必須用到Instruction 1的結果,那麼處理器會保證Instruction 1會在Instruction 2之前執行。

結論:單執行緒下,指令重排序會考慮資料依賴性,不會影響程式執行的結果。

3.3.3 有序性舉例(多執行緒下指令重排會造成執行緒安全問題)

雖然重排序不會影響單個執行緒內程式執行的結果,但是多執行緒呢?下面看一個例子:

//執行緒1:
context = loadContext();   //語句1
inited = true;             //語句2
 
//執行緒2:
while(!inited ){
  sleep()
}
doSomethingwithconfig(context);

上面程式碼中,由於語句1和語句2沒有資料依賴性,因此可能會被重排序。假如發生了重排序,線上程1執行過程中先執行語句2,而此是執行緒2會以為初始化工作已經完成,那麼就會跳出while迴圈,去執行doSomethingwithconfig(context)方法,而此時context並沒有被初始化,就會導致程式出錯。

從上面可以看出,指令重排序不會影響單個執行緒的執行,但是會影響到執行緒併發執行的正確性。

也就是說,要想併發程式正確地執行,必須要保證原子性、可見性以及有序性。只要有一個沒有被保證,就有可能會導致程式執行不正確。

四、Java記憶體模型(synchronized和lock如何保證原子性、可見性、有序性)

一句話:JMM是Java併發在JVM層面的解釋,即在JVM層面解釋Java併發,其中包括 8個原子性操作和執行規則,還有 8個在保證有序性前提下的 Happens-Before 原則,都是要聯絡起來記憶的。
硬體層面,CPU通過快取來訪問主存;Java層面,Java執行緒/執行引擎 通過 工作記憶體來訪問主存。
可見性,原子性,有序性都可以通過JMM來解釋,可見性問題之所以出現是因為各個執行緒的工作記憶體之間不可見,原子性問題之所以出現是因為 Java/執行緒 通過工作記憶體讀寫主存的某段程式碼,存在被打斷;有序性問題之所以存在是因為編譯層面存在的指令重排。
硬體層面,可見性問題之所以出現是因為各個CPU快取值之間不可見,原子性問題之所以出現是 作業系統 的分時CPU原則 使得某些臨界資源(如記憶體、磁碟)無法原子化訪問,有序性問題之所以出現是因為編譯層面存在指令重排。

在Java虛擬機器規範中試圖定義一種Java記憶體模型(Java Memory Model,JMM)來遮蔽各個硬體平臺和作業系統的記憶體訪問差異,以實現讓Java程式在各種平臺下都能達到一致的記憶體訪問效果。那麼Java記憶體模型規定了哪些東西呢,它定義了程式中變數的訪問規則,往大一點說是定義了程式執行的次序。注意,為了獲得較好的執行效能,Java記憶體模型並沒有限制執行引擎使用處理器的暫存器或者快取記憶體來提升指令執行速度,也沒有限制編譯器對指令進行重排序。也就是說,在java記憶體模型中,也會存在快取一致性問題和指令重排序的問題。

Java記憶體模型規定所有的變數都是存在主存當中(類似於前面說的實體記憶體),每個執行緒都有自己的工作記憶體(類似於前面的快取記憶體)。執行緒對變數的所有操作都必須在工作記憶體中進行,而不能直接對主存進行操作。並且每個執行緒不能訪問其他執行緒的工作記憶體。

舉個簡單的例子:在java中,執行下面這個語句:

i  = 10;

執行執行緒必須先在自己的工作執行緒中對變數i所在的快取行進行賦值操作,然後再寫入主存當中。而不是直接將數值10寫入主存當中。

那麼Java語言 本身對 原子性、可見性以及有序性提供了哪些保證呢?

4.1 原子性

在Java中,對基本資料型別的變數的讀取和賦值操作是原子性操作,即這些操作是不可被中斷的,要麼執行,要麼不執行。

上面一句話雖然看起來簡單,但是理解起來並不是那麼容易。看下面一個例子i:

請分析以下哪些操作是原子性操作:

x = 10;         //語句1   一步操作
y = x;         //語句2  兩步操作 讀取x:主記憶體->工作記憶體  寫入y:工作記憶體->主記憶體
x++;           //語句3  三步操作  讀取  賦值assign  寫入
x = x + 1;     //語句4  三步操作

咋一看,有些朋友可能會說上面的4個語句中的操作都是原子性操作。其實只有語句1是原子性操作,其他三個語句都不是原子性操作。

語句1是直接將數值10賦值給x,也就是說執行緒執行這個語句的會直接將數值10寫入到工作記憶體中。

語句2實際上包含2個操作,它先要去讀取x的值,再將x的值寫入工作記憶體,雖然讀取x的值以及 將x的值寫入工作記憶體 這2個操作都是原子性操作,但是合起來就不是原子性操作了。

語句3 和語句4 ,x++和 x = x+1包括3個操作:讀取x的值,進行加1操作,寫入新的值。

所以上面4個語句只有語句1的操作具備原子性。

也就是說,只有簡單的讀取、賦值(而且必須是將數字賦值給某個變數,變數之間的相互賦值不是原子操作)才是原子操作。

只有讀取和常量複製才是原子操作
變數賦值是兩步操作,常量計算是兩步操作。
變數計算是三步操作。

不過這裡有一點需要注意:在32位平臺下,對64位資料的讀取和賦值是需要通過兩個操作來完成的,即long型別和double型別,不能保證其原子性。但是好像在最新的JDK中,JVM已經保證對64位資料的讀取和賦值也是原子性操作了。

從上面可以看出,Java記憶體模型只保證了基本讀取和賦值是原子性操作,如果要實現更大範圍操作的原子性,可以通過synchronized和Lock來實現。由於synchronized和Lock能夠保證任一時刻只有一個執行緒執行該程式碼塊,那麼自然就不存在原子性問題了,從而保證了原子性。

問題:synchronized和Lock如何保證操作的原子性?
回答:synchronized和Lock通過保證任一時刻只有一個執行緒執行含有共享變數的程式碼塊(對於沒有 synchronized和Lock修飾的非同步方法、非同步程式碼塊,不會阻塞的,它們與 synchronized和Lock無關),那麼自然就不存在原子性問題了,從而保證了原子性。

4.2 可見性

對於可見性,Java提供了volatile關鍵字來保證可見性。

當一個共享變數被volatile修飾時,它會保證修改的值會立即被更新到主存,當有其他執行緒需要讀取時,它會去記憶體中讀取新值。

而普通的共享變數不能保證可見性,因為普通共享變數被修改之後,什麼時候被寫入主存是不確定的,當其他執行緒去讀取時,此時記憶體中可能還是原來的舊值,因此無法保證可見性。

另外,通過synchronized和Lock也能夠保證可見性,synchronized和Lock能保證同一時刻只有一個執行緒獲取鎖然後執行同步程式碼,並且在釋放鎖之前會將對變數的修改重新整理到主存當中。因此可以保證可見性。

問題:synchronized和Lock如何保證操作的可見性?
回答:synchronized和Lock通過保證同一時刻只有一個執行緒獲取鎖然後執行同步程式碼(保證原子性),並且在釋放鎖之前會將對變數的修改重新整理到主存當中(保證可見性),因此可以保證可見性。

4.3 有序性與指令重排序

金手指:指令重排序和happens-before原則/先行發生原則,只和有序性相關,與原子性、可見性無關。

在Java記憶體模型中,允許編譯器和處理器對指令進行重排序,但是重排序過程不會影響到單執行緒程式的執行,卻會影響到多執行緒併發執行的正確性。

在Java裡面,可以通過volatile關鍵字來保證一定的“有序性”(具體原理在下一節講述)。另外可以通過synchronized和Lock來保證有序性,很顯然,synchronized和Lock保證每個時刻是有一個執行緒執行同步程式碼,相當於是讓執行緒順序執行同步程式碼,自然就保證了有序性。

問題:synchronized和Lock如何保證操作的有序性?
回答:synchronized和Lock保證每個時刻是有一個執行緒執行同步程式碼(保證原子性),其原子內部順序執行,保證有序性,原子外部沒有互斥資源,不需要保證有序性,所有保證了有序性。

附加:happens-before原則/先行發生原則:先天有序性

happens-before原則定義:JMM具備八個先天的“有序性”,即不需要通過任何手段就能夠得到保證的有序性。

下面就來具體介紹下happens-before原則(先行發生原則):

  1. 程式次序規則:一個執行緒內,按照程式碼順序,書寫在前面的操作先行發生於書寫在後面的操作;
  2. 鎖定規則:一個unLock操作先行發生於後面對同一個鎖額lock操作;
  3. volatile變數規則:對一個變數的寫操作先行發生於後面對這個變數的讀操作;
  4. 傳遞規則:如果操作A先行發生於操作B,而操作B又先行發生於操作C,則可以得出操作A先行發生於操作C;
  5. 執行緒啟動規則:Thread物件的start()方法先行發生於此執行緒的每個一個動作;
  6. 執行緒中斷規則:對執行緒interrupt()方法的呼叫先行發生於被中斷執行緒的程式碼檢測到中斷事件的發生;
  7. 執行緒終結規則:執行緒中所有的操作都先行發生於執行緒的終止檢測,我們可以通過Thread.join()方法結束、Thread.isAlive()的返回值手段檢測到執行緒已經終止執行;
  8. 物件終結規則:一個物件的初始化完成先行發生於他的finalize()方法的開始。

這8條規則中,前4條規則是比較重要的,後4條規則都是顯而易見的。

下面我們來解釋一下前4條規則:

第一條規則:對於程式次序規則來說,我的理解就是一段程式程式碼的執行在單個執行緒中看起來是有序的。注意,雖然這條規則中提到“書寫在前面的操作先行發生於書寫在後面的操作”,這個應該是程式看起來執行的順序是按照程式碼順序執行的,因為虛擬機器可能會對程式程式碼進行指令重排序。雖然進行重排序,但是最終執行的結果是與程式順序執行的結果一致的,它只會對不存在資料依賴性的指令進行重排序。因此,在單個執行緒中,程式執行看起來是有序執行的,這一點要注意理解。事實上,這個規則是用來保證程式在單執行緒中執行結果的正確性,但無法保證程式在多執行緒中執行的正確性。

第二條規則也比較容易理解,也就是說無論在單執行緒中還是多執行緒中,同一個鎖如果出於被鎖定的狀態,那麼必須先對鎖進行了釋放操作,後面才能繼續進行lock操作。

第三條規則是一條比較重要的規則,也是後文將要重點講述的內容。直觀地解釋就是,如果一個執行緒先去寫一個變數,然後一個執行緒去進行讀取,那麼寫入操作肯定會先行發生於讀操作。

第四條規則實際上就是體現happens-before原則具備傳遞性。

附加:如果兩個操作的執行次序無法從happens-before原則推匯出來,那麼它們就不能保證它們的有序性,虛擬機器可以隨意地對它們進行重排序。

五、深入剖析volatile關鍵字

在前面講述了很多東西,其實都是為講述volatile關鍵字作鋪墊,那麼接下來我們就進入主題。

5.1 volatile關鍵字的兩層語義

一旦一個共享變數(類的成員變數、類的靜態成員變數)被volatile修飾之後,那麼就具備了兩層語義:

  1. 保證了不同執行緒對這個變數進行操作時的可見性,即一個執行緒修改了某個變數的值,這新值對其他執行緒來說是立即可見的。

  2. 禁止指令重排序。

(1)volatile修飾的變數進行寫操作,立即可見,從而保證可見性;(強制將對快取的修改操作(即寫操作)立即寫入主存;如果是寫操作,導致其他CPU中對應的快取行無效,讓其他CPU只能從主存中拿剛剛更新的,兩個操作(立即寫入主存和使其他CPU中對應的快取行失效)保證可見性)

(2)第一層含義的不足,volatile修飾的變數進行讀操作,是不可見的,所有CAS,從而不保證原子性

(3)volatile修飾的變數禁止指令重排序,它確保指令重排序時不會把其後面的指令排到記憶體屏障之前的位置,也不會把前面的指令排到記憶體屏障的後面;即在執行到記憶體屏障這句指令時,在它前面的操作已經全部完成

(4)第二層含義的不足,語句3中包含volatile修飾的變數,但是語句1和語句2的順序、語句4和語句5的順序是不作任何保證的。

可見性只能保證每次讀取的是最新的值,原子性保證

5.2 volatile修飾的變數保證可見性

本節stop = true; 中常量複製,是原子操作,只要保證可見性,所以正確。
下一節中自增操作是三步操作,所有要同時保證原子性和可見性,所以出錯。

volatile修飾的變數進行寫操作,立即可見,

先看一段程式碼,假如執行緒1先執行,執行緒2後執行:

//執行緒1
boolean stop = false;  
while(!stop){
    doSomething();
}
 
//執行緒2
stop = true;  // 常量複製,是原子操作

這段程式碼是很典型的一段程式碼,很多人在中斷執行緒時可能都會採用這種標記辦法。但是事實上,這段程式碼會完全執行正確麼?即一定會將執行緒中斷麼?不一定,也許在大多數時候,這個程式碼能夠把執行緒中斷,但是也有可能會導致無法中斷執行緒(雖然這個可能性很小,但是隻要一旦發生這種情況就會造成死迴圈了)。

下面解釋一下這段程式碼為何有可能導致無法中斷執行緒。在前面已經解釋過,每個執行緒在執行過程中都有自己的工作記憶體,那麼執行緒1在執行的時候,會將stop變數的值拷貝一份放在自己的工作記憶體當中。

那麼當執行緒2更改了stop變數的值之後,但是還沒來得及寫入主存當中,執行緒2轉去做其他事情了,那麼執行緒1由於不知道執行緒2對stop變數的更改,因此還會一直迴圈下去。

但是用volatile修飾之後就變得不一樣了:

第一:使用volatile關鍵字會強制將修改的值立即寫入主存;

第二:使用volatile關鍵字的話,當執行緒2進行修改時,會導致執行緒1的工作記憶體中快取變數stop的快取行無效(反映到硬體層的話,就是CPU的L1或者L2快取中對應的快取行無效);

JVM層面(各個工作記憶體和主記憶體),執行緒中工作記憶體快取行失效,只能到主存中拿;
硬體層面(各個CPU快取和主記憶體),CPU中快取行失效,只能到主存中拿。

第三:由於執行緒1的工作記憶體中快取變數stop的快取行無效,所以執行緒1再次讀取變數stop的值時會去主存讀取。

那麼線上程2修改stop值時(當然這裡包括2個操作,修改執行緒2工作記憶體中的值,然後將修改後的值寫入記憶體),會使得執行緒1的工作記憶體中快取變數stop的快取行無效,然後執行緒1讀取時,發現自己的快取行無效,它會等待快取行對應的主存地址被更新之後,然後去對應的主存讀取最新的值。

那麼執行緒1讀取到的就是最新的正確的值。

5.3 volatile不能保證原子性

上一節stop = true; 中常量複製,是原子操作,只要保證可見性,所以正確。
本節中自增操作是三步操作,所有要同時保證原子性和可見性,所以出錯。

從上面知道volatile關鍵字保證了操作的可見性,但是volatile能保證對變數的操作是原子性嗎?

下面看一個例子:

public class Test {
    public volatile int inc = 0;
     
    public void increase() {
        inc++;
    }
     
    public static void main(String[] args) {
        final Test test = new Test();
        for(int i=0;i<10;i++){
            new Thread(){
                public void run() {
                    for(int j=0;j<1000;j++)
                        test.increase();
                };
            }.start();
        }
         
        while(Thread.activeCount()>1)  //保證前面的執行緒都執行完
            Thread.yield();
        System.out.println(test.inc);
    }
}

大家想一下這段程式的輸出結果是多少?也許有些朋友認為是10000。但是事實上執行它會發現每次執行結果都不一致,都是一個小於10000的數字。

可能有的朋友就會有疑問,不對啊,上面是對變數inc進行自增操作,由於volatile保證了可見性,那麼在每個執行緒中對inc自增完之後,在其他執行緒中都能看到修改後的值啊,所以有10個執行緒分別進行了1000次操作,那麼最終inc的值應該是1000*10=10000。

這裡面就有一個誤區了,volatile關鍵字能保證可見性沒有錯,但是上面的程式錯在沒能保證原子性。可見性只能保證每次讀取的是最新的值,但是volatile沒辦法保證對變數的操作的原子性。

在前面已經提到過,自增操作是不具備原子性的,它包括讀取變數的原始值、進行加1操作、寫入工作記憶體。那麼就是說自增操作的三個子操作可能會分割開執行,就有可能導致下面這種情況出現:

假如某個時刻變數inc的值為10,

執行緒1對變數進行自增操作,執行緒1先讀取了變數inc的原始值(讀取、累加、寫入,執行緒1僅僅讀取了),然後執行緒1被阻塞了;

然後執行緒2對變數進行自增操作,執行緒2也去讀取變數inc的原始值,由於執行緒1只是對變數inc進行讀取操作,而沒有對變數進行修改操作,所以不會導致執行緒2的工作記憶體中快取變數inc的快取行無效,所以執行緒2會直接去主存讀取inc的值,發現inc的值時10,然後進行加1操作,並把11寫入工作記憶體,最後寫入主存。

然後執行緒1接著進行加1操作,由於已經讀取了inc的值,注意此時線上程1的工作記憶體中inc的值仍然為10,所以執行緒1對inc進行加1操作後inc的值為11,然後將11寫入工作記憶體,最後寫入主存。

那麼兩個執行緒分別進行了一次自增操作後,inc只增加了1。

解釋到這裡,可能有朋友會有疑問,不對啊,前面不是保證一個變數在修改volatile變數時,會讓快取行無效嗎?然後其他執行緒去讀就會讀到新的值,對,這個沒錯。這個就是上面的happens-before規則中的volatile變數規則,但是要注意,執行緒1對變數進行讀取操作之後,被阻塞了的話,並沒有對inc值進行修改。然後雖然volatile能保證執行緒2對變數inc的值讀取是從記憶體中讀取的,但是執行緒1沒有進行修改,所以執行緒2根本就不會看到修改的值。

根源就在這裡,自增操作不是原子性操作,而且volatile也無法保證對變數的任何操作都是原子性的。

把上面的程式碼改成以下任何一種都可以達到效果(保證累加操作的一致性):

採用synchronized:

public class Test {
    public  int inc = 0;
    
    public synchronized void increase() {
        inc++;
    }
    
    public static void main(String[] args) {
        final Test test = new Test();
        for(int i=0;i<10;i++){
            new Thread(){
                public void run() {
                    for(int j=0;j<1000;j++)
                        test.increase();
                };
            }.start();
        }
        
        while(Thread.activeCount()>1)  //保證前面的執行緒都執行完
            Thread.yield();
        System.out.println(test.inc);
    }
}

採用Lock:

public class Test {
    public  int inc = 0;
    Lock lock = new ReentrantLock();
    
    public  void increase() {
        lock.lock();
        try {
            inc++;
        } finally{
            lock.unlock();
        }
    }
    
    public static void main(String[] args) {
        final Test test = new Test();
        for(int i=0;i<10;i++){
            new Thread(){
                public void run() {
                    for(int j=0;j<1000;j++)
                        test.increase();
                };
            }.start();
        }
        
        while(Thread.activeCount()>1)  //保證前面的執行緒都執行完
            Thread.yield();
        System.out.println(test.inc);
    }
}

採用AtomicInteger:

public class Test {
    public  AtomicInteger inc = new AtomicInteger();
     
    public  void increase() {
        inc.getAndIncrement();
    }
    
    public static void main(String[] args) {
        final Test test = new Test();
        for(int i=0;i<10;i++){
            new Thread(){
                public void run() {
                    for(int j=0;j<1000;j++)
                        test.increase();
                };
            }.start();
        }
        
        while(Thread.activeCount()>1)  //保證前面的執行緒都執行完
            Thread.yield();
        System.out.println(test.inc);
    }
}

在java 1.5的java.util.concurrent.atomic包下提供了一些原子操作類,即對基本資料型別的 自增(加1操作),自減(減1操作)、以及加法操作(加一個數),減法操作(減一個數)進行了封裝,保證這些操作是原子性操作。atomic是利用CAS來實現原子性操作的(Compare And Swap),CAS實際上是利用處理器提供的CMPXCHG指令實現的,而處理器執行CMPXCHG指令是一個原子性操作。

問題:atomic是利用CAS來實現原子性操作的(Compare And Swap)什麼意思?
回答:

5.4 volatile能保證有序性嗎?合理地使用volatile可以保證有序性

在前面提到volatile關鍵字能禁止指令重排序,所以volatile能在一定程度上保證有序性。

volatile關鍵字禁止指令重排序有兩層意思:

1)在程式執行時,當程式執行到volatile變數的讀操作或者寫操作時,在其前面的操作的更改肯定全部已經進行,且結果已經對後面的操作可見;在其後面的操作肯定還沒有進行;

2)在指令優化時,不能將在對volatile變數訪問的語句放在其後面執行,也不能把volatile變數後面的語句放到其前面執行。

兩個不同的,第一條指明程式執行的情況,第二條指明指令優化不能違反第一條所保證的,只能指令優化被volatile變數分隔的。

可能上面說的比較繞,舉個簡單的例子:

//x、y為非volatile變數
//flag為volatile變數
 
x = 2;        //語句1
y = 0;        //語句2
flag = true;  //語句3
x = 4;         //語句4
y = -1;       //語句5

由於flag變數為volatile變數,那麼在進行指令重排序的過程的時候,不會將語句3放到語句1、語句2前面,也不會講語句3放到語句4、語句5後面。但是要注意語句1和語句2的順序、語句4和語句5的順序是不作任何保證的。

並且volatile關鍵字能保證,執行到語句3時,語句1和語句2必定是執行完畢了的,且語句1和語句2的執行結果對語句3、語句4、語句5是可見的。

那麼我們回到前面舉的一個例子:

//執行緒1:
context = loadContext();   //語句1
inited = true;             //語句2
 
//執行緒2:
while(!inited ){
  sleep()
}
doSomethingwithconfig(context);

前面舉這個例子的時候,提到有可能語句2會在語句1之前執行,那麼久可能導致context還沒被初始化,而執行緒2中就使用未初始化的context去進行操作,導致程式出錯。

這裡如果用volatile關鍵字對inited變數進行修飾,就不會出現這種問題了,因為當執行到語句2時,必定能保證context已經初始化完畢。

5.5 volatile底層原理:volatile底層是如何保證可見性和有序性的?lock字首指令

前面講述了源於volatile關鍵字的一些使用,下面我們來探討一下volatile到底如何保證可見性和禁止指令重排序的。

下面這段話摘自《深入理解Java虛擬機器》:

“觀察加入volatile關鍵字和沒有加入volatile關鍵字時所生成的彙編程式碼發現,加入volatile關鍵字時,會多出一個lock字首指令”

lock字首指令實際上相當於一個記憶體屏障(也成記憶體柵欄),記憶體屏障會提供3個功能:

1)它確保指令重排序時不會把其後面的指令排到記憶體屏障之前的位置,也不會把前面的指令排到記憶體屏障的後面;即在執行到記憶體屏障這句指令時,在它前面的操作已經全部完成;(保證有序性)

2)它會強制將對快取的修改操作(即寫操作)立即寫入主存;(保證可見性)

3)如果是寫操作,它會導致其他CPU中對應的快取行無效。(保證可見性)

六、使用volatile關鍵字的場景(voliatile代替synchronized,彌補原子性)

synchronized關鍵字是防止多個執行緒同時執行一段程式碼,那麼就會很影響程式執行效率,而volatile關鍵字在某些情況下效能要優於synchronized,但是要注意volatile關鍵字是無法替代synchronized關鍵字的,因為volatile關鍵字無法保證操作的原子性。通常來說,使用volatile必須具備以下2個條件:

  1. 對volatile變數的寫操作不依賴於當前值
  2. 該volatile變數沒有包含在具有其他變數的不變式中

金手指:這兩個條件是對程式設計師寫程式的時候的要求

實際上,這些條件表明,可以被寫入 volatile 變數的這些有效值獨立於任何程式的狀態,包括變數的當前狀態。

事實上,我的理解就是上面的2個條件需要保證操作是原子性操作,才能保證使用volatile關鍵字的程式在併發時能夠正確執行。

下面列舉幾個Java中使用volatile的幾個場景。

  1. 狀態標記量(程式設計師使用狀態標記量來保證volatile的兩個性質,狀態標誌量是常量賦值,唯二的兩個原子操作是讀取和常量賦值,所以只有保證可見性和有序性即可,所以可以使用volatile代替synchronized關鍵字)
volatile boolean flag = false;   // 從三個性質上來說,flag 是volatile 變數,是狀態標記量,常量賦值保證原子性
// 從兩個條件上來說,無論是flag=false這一句,還是下面的flag=true那句
// 第一,這裡對volatile變數的寫操作不依賴於當前值
// 第二,volatile變數沒有包含在具有其他變數的不變式中
while(!flag){
    doSomething();
}
 
public void setFlag() {
    flag = true; 
}
volatile boolean inited = false;   // 從三個性質上來說,inited 是volatile 變數,是狀態標記量,常量賦值保證原子性
// 從兩個條件上來說,無論是inited =false這一句,還是下面的inited =true那句
// 第一,這裡對volatile變數的寫操作不依賴於當前值
// 第二,volatile變數沒有包含在具有其他變數的不變式中
//執行緒1:
context = loadContext();  
inited = true;            
 
//執行緒2:
while(!inited ){
sleep()
}
doSomethingwithconfig(context);
  1. double check(程式設計師使用兩次檢測來保證volatile的兩個性質)
class Singleton{
    private volatile static Singleton instance = null; 
     //從三個性質上來說,  instance 是 volatile 變數,唯二賦值第一個是這裡賦值常量null,原子操作一定沒問題
 // 第二個操作是雙層if中的new Singleton(),雖然不是原子操作,但是雙層if保證不會讓其他執行緒進來,保證不會有其他打斷這個new Singleton()操作  

// 從兩個條件上來說,無論是instance = null和instance = new Singleton()這一句
// 第一,這裡對volatile變數的寫操作不依賴於當前值
// 第二,volatile變數沒有包含在具有其他變數的不變式中  
    private Singleton() {
         
    }
     
    public static Singleton getInstance() {
        if(instance==null) {
            synchronized (Singleton.class) {
                if(instance==null)
                    instance = new Singleton();
            }
        }
        return instance;
    }
}

七、面試金手指

7.1 synchronized/lock如何實現原子性、有序性、可見性

synchronized和Lock如何保證操作的原子性?
synchronized和Lock通過保證任一時刻只有一個執行緒執行含有共享變數的程式碼塊(對於沒有 synchronized和Lock修飾的非同步方法、非同步程式碼塊,不會阻塞的,它們與 synchronized和Lock無關),那麼自然就不存在原子性問題了,從而保證了原子性。

synchronized和Lock如何保證操作的可見性?
synchronized和Lock通過保證同一時刻只有一個執行緒獲取鎖然後執行同步程式碼(保證原子性),並且在釋放鎖之前會將對變數的修改重新整理到主存當中(保證可見性),因此可以保證可見性。

synchronized和Lock如何保證操作的有序性?
synchronized和Lock保證每個時刻是有一個執行緒執行同步程式碼(保證原子性),其原子內部順序執行,保證有序性,原子外部沒有互斥資源,不需要保證有序性,所有保證了有序性。

7.2 哪些是原子操作,哪些是非原子操作?

只有讀取和常量複製才是原子操作
變數賦值是兩步操作,常量計算是兩步操作。
變數計算是三步操作。

7.3 有序性中的 happen-before 先行發生原則?

Java記憶體模型具備一些先天的“有序性”,即不需要通過任何手段就能夠得到保證的有序性,這個通常也稱為happens-before原則。

如果兩個操作執行次序可以使用happens-before推匯出來,則先後順序確定,虛擬機器無法對其重排序。

如果兩個操作的執行次序無法從happens-before原則推匯出來,那麼它們就不能保證它們的有序性,虛擬機器可以隨意地對它們進行重排序。

下面就來具體介紹下happens-before原則(先行發生原則):

(1)程式次序規則:一個執行緒內,按照程式碼順序,書寫在前面的操作先行發生於書寫在後面的操作;

(2)鎖定規則:一個unLock操作先行發生於後面對同一個鎖額lock操作;

(3)volatile變數規則:對一個變數的寫操作先行發生於後面對這個變數的讀操作;

(4)傳遞規則:如果操作A先行發生於操作B,而操作B又先行發生於操作C,則可以得出操作A先行發生於操作C;

(5)執行緒啟動規則:Thread物件的start()方法先行發生於此執行緒的每個一個動作;

(6)執行緒中斷規則:對執行緒interrupt()方法的呼叫先行發生於被中斷執行緒的程式碼檢測到中斷事件的發生;

(7)執行緒終結規則:執行緒中所有的操作都先行發生於執行緒的終止檢測,我們可以通過Thread.join()方法結束、Thread.isAlive()的返回值手段檢測到執行緒已經終止執行;

(8)物件終結規則:一個物件的初始化完成先行發生於他的finalize()方法的開始。

這8條規則中,前4條規則是比較重要的,後4條規則都是顯而易見的。

下面我們來解釋一下前4條規則:

第一條規則:對於程式次序規則來說,我的理解就是一段程式程式碼的執行在單個執行緒中看起來是有序的。注意,雖然這條規則中提到“書寫在前面的操作先行發生於書寫在後面的操作”,這個應該是程式看起來執行的順序是按照程式碼順序執行的,因為虛擬機器可能會對程式程式碼進行指令重排序。雖然進行重排序,但是最終執行的結果是與程式順序執行的結果一致的,它只會對不存在資料依賴性的指令進行重排序。因此,在單個執行緒中,程式執行看起來是有序執行的,這一點要注意理解。事實上,這個規則是用來保證程式在單執行緒中執行結果的正確性,但無法保證程式在多執行緒中執行的正確性。

第二條規則也比較容易理解,也就是說無論在單執行緒中還是多執行緒中,同一個鎖如果出於被鎖定的狀態,那麼必須先對鎖進行了釋放操作,後面才能繼續進行lock操作。

第三條規則是一條比較重要的規則,也是後文將要重點講述的內容。直觀地解釋就是,如果一個執行緒先去寫一個變數,然後一個執行緒去進行讀取,那麼寫入操作肯定會先行發生於讀操作。

第四條規則實際上就是體現happens-before原則具備傳遞性。

7.4 volatile保證可見性、有序性、不保證原子性?

(1)volatile修飾的變數進行寫操作,立即可見,從而保證可見性;(強制將對快取的修改操作(即寫操作)立即寫入主存;如果是寫操作,導致其他CPU中對應的快取行無效,讓其他CPU只能從主存中拿剛剛更新的,兩個操作(立即寫入主存和使其他CPU中對應的快取行失效)保證可見性)
JVM層面,執行緒中工作記憶體快取行失效,只能到主存中拿;
硬體層面,CPU中快取行失效,只能到主存中拿。

(2)第一層含義的不足,volatile修飾的變數進行讀操作,是不可見的,是不更新的

(3)volatile修飾的變數禁止指令重排序,它確保指令重排序時不會把其後面的指令排到記憶體屏障之前的位置,也不會把前面的指令排到記憶體屏障的後面;即在執行到記憶體屏障這句指令時,在它前面的操作已經全部完成
  1)在程式執行時,當程式執行到volatile變數的讀操作或者寫操作時,在其前面的操作的更改肯定全部已經進行,且結果已經對後面的操作可見;在其後面的操作肯定還沒有進行;
  2)在指令優化時,不能將在對volatile變數訪問的語句放在其後面執行,也不能把volatile變數後面的語句放到其前面執行。
兩個不同的,第一條指明程式執行的情況,第二條指明指令優化不能違反第一條所保證的,只能指令優化被volatile變數分隔的。

(4)第二層含義的不足,語句3中包含volatile修飾的變數,但是語句1和語句2的順序、語句4和語句5的順序是不作任何保證的。
可見性只能保證每次讀取的是最新的值,原子性保證操作不被打斷。

比如 stop = true; 中常量複製,是原子操作,只要保證可見性,所以正確。
又如 自增操作是三步操作,所有要同時保證原子性和可見性,所以出錯。

7.5 volatile底層原理:volatile底層是如何保證可見性和有序性的?

lock字首指令

7.6 如何彌補volatile關鍵字的不足?

1)對volatile變數的寫操作不依賴於當前值

2)該volatile變數沒有包含在具有其他變數的不變式中

舉例:標記位和單例模式雙層檢測

八、小結

volidate關鍵字,完成了。

天天打碼,天天進步!!!