你真的瞭解volatile關鍵字嗎?
一、Java記憶體模型
想要理解volatile為什麼能確保可見性,就要先理解Java中的記憶體模型是什麼樣的。
Java記憶體模型規定了所有的變數都儲存在主記憶體中。每條執行緒中還有自己的工作記憶體,執行緒的工作記憶體中儲存了被該執行緒所使用到的變數(這些變數是從主記憶體中拷貝而來)。執行緒對變數的所有操作(讀取,賦值)都必須在工作記憶體中進行。不同執行緒之間也無法直接訪問對方工作記憶體中的變數,執行緒間變數值的傳遞均需要通過主記憶體來完成。
基於此種記憶體模型,便產生了多執行緒程式設計中的資料“髒讀”等問題。
舉個簡單的例子:在java中,執行下面這個語句:
1 | i = 10 ++; |
執行執行緒必須先在自己的工作執行緒中對變數i所在的快取行進行賦值操作,然後再寫入主存當中。而不是直接將數值10寫入主存當中。
比如同時有2個執行緒執行這段程式碼,假如初始時i的值為10,那麼我們希望兩個執行緒執行完之後i的值變為12。但是事實會是這樣嗎?
可能存在下面一種情況:初始時,兩個執行緒分別讀取i的值存入各自所在的工作記憶體當中,然後執行緒1進行加1操作,然後把i的最新值11寫入到記憶體。此時執行緒2的工作記憶體當中i的值還是10,進行加1操作之後,i的值為11,然後執行緒2把i的值寫入記憶體。
最終結果i的值是11,而不是12。這就是著名的快取一致性問題。通常稱這種被多個執行緒訪問的變數為共享變數。
那麼如何確保共享變數在多執行緒訪問時能夠正確輸出結果呢?
在解決這個問題之前,我們要先了解併發程式設計的三大概念:原子性,有序性,可見性。
二、原子性
1.定義
原子性:即一個操作或者多個操作 要麼全部執行並且執行的過程不會被任何因素打斷,要麼就都不執行。
2.例項
一個很經典的例子就是銀行賬戶轉賬問題:
比如從賬戶A向賬戶B轉1000元,那麼必然包括2個操作:從賬戶A減去1000元,往賬戶B加上1000元。
試想一下,如果這2個操作不具備原子性,會造成什麼樣的後果。假如從賬戶A減去1000元之後,操作突然中止。這樣就會導致賬戶A雖然減去了1000元,但是賬戶B沒有收到這個轉過來的1000元。
所以這2個操作必須要具備原子性才能保證不出現一些意外的問題。
同樣地反映到併發程式設計中會出現什麼結果呢?
舉個最簡單的例子,大家想一下假如為一個32位的變數賦值過程不具備原子性的話,會發生什麼後果?
1 | i = 9 ; |
假若一個執行緒執行到這個語句時,我暫且假設為一個32位的變數賦值包括兩個過程:為低16位賦值,為高16位賦值。
那麼就可能發生一種情況:當將低16位數值寫入之後,突然被中斷,而此時又有一個執行緒去讀取i的值,那麼讀取到的就是錯誤的資料。
3.Java中的原子性
在Java中,對基本資料型別的變數的讀取和賦值操作是原子性操作,即這些操作是不可被中斷的,要麼執行,要麼不執行。
上面一句話雖然看起來簡單,但是理解起來並不是那麼容易。看下面一個例子i:
請分析以下哪些操作是原子性操作:
1234 | x = 10 ; //語句1 y = x; //語句2 x++; //語句3 x = x + 1 ; //語句4 |
咋一看,可能會說上面的4個語句中的操作都是原子性操作。其實只有語句1是原子性操作,其他三個語句都不是原子性操作。
語句1是直接將數值10賦值給x,也就是說執行緒執行這個語句的會直接將數值10寫入到工作記憶體中。
語句2實際上包含2個操作,它先要去讀取x的值,再將x的值寫入工作記憶體,雖然讀取x的值以及 將x的值寫入工作記憶體 這2個操作都是原子性操作,但是合起來就不是原子性操作了。
同樣的,x++和 x = x+1包括3個操作:讀取x的值,進行加1操作,寫入新的值。
所以上面4個語句只有語句1的操作具備原子性。
也就是說,只有簡單的讀取、賦值(而且必須是將數字賦值給某個變數,變數之間的相互賦值不是原子操作)才是原子操作。
從上面可以看出,Java記憶體模型只保證了基本讀取和賦值是原子性操作,如果要實現更大範圍操作的原子性,可以通過synchronized和Lock來實現。由於synchronized和Lock能夠保證任一時刻只有一個執行緒執行該程式碼塊,那麼自然就不存在原子性問題了,從而保證了原子性。
三、可見性
1.定義
可見性是指當多個執行緒訪問同一個變數時,一個執行緒修改了這個變數的值,其他執行緒能夠立即看得到修改的值。
2.例項
舉個簡單的例子,看下面這段程式碼:
123456 | //執行緒1執行的程式碼 int i = 0 ; i = 10 ; //執行緒2執行的程式碼 j = i; |
由上面的分析可知,當執行緒1執行 i =10這句時,會先把i的初始值載入到工作記憶體中,然後賦值為10,那麼線上程1的工作記憶體當中i的值變為10了,卻沒有立即寫入到主存當中。
此時執行緒2執行 j = i,它會先去主存讀取i的值並載入到執行緒2的工作記憶體當中,注意此時記憶體當中i的值還是0,那麼就會使得j的值為0,而不是10.
這就是可見性問題,執行緒1對變數i修改了之後,執行緒2沒有立即看到執行緒1修改的值。
3.Java中的可見性
對於可見性,Java提供了volatile關鍵字來保證可見性。
當一個共享變數被volatile修飾時,它會保證修改的值會立即被更新到主存,當有其他執行緒需要讀取時,它會去記憶體中讀取新值。
而普通的共享變數不能保證可見性,因為普通共享變數被修改之後,什麼時候被寫入主存是不確定的,當其他執行緒去讀取時,此時記憶體中可能還是原來的舊值,因此無法保證可見性。
另外,通過synchronized和Lock也能夠保證可見性,synchronized和Lock能保證同一時刻只有一個執行緒獲取鎖然後執行同步程式碼,並且在釋放鎖之前會將對變數的修改重新整理到主存當中。因此可以保證可見性。
四、有序性
1.定義
有序性:即程式執行的順序按照程式碼的先後順序執行。
2.例項
舉個簡單的例子,看下面這段程式碼:
123456 | int i = 0 ; boolean flag = false ; i = 1 ; //語句1 flag = true ; //語句2 |
上面程式碼定義了一個int型變數,定義了一個boolean型別變數,然後分別對兩個變數進行賦值操作。從程式碼順序上看,語句1是在語句2前面的,那麼JVM在真正執行這段程式碼的時候會保證語句1一定會在語句2前面執行嗎?不一定,為什麼呢?這裡可能會發生指令重排序(Instruction Reorder)。
下面解釋一下什麼是指令重排序,一般來說,處理器為了提高程式執行效率,可能會對輸入程式碼進行優化,它不保證程式中各個語句的執行先後順序同程式碼中的順序一致,但是它會保證程式最終執行結果和程式碼順序執行的結果是一致的。
比如上面的程式碼中,語句1和語句2誰先執行對最終的程式結果並沒有影響,那麼就有可能在執行過程中,語句2先執行而語句1後執行。
但是要注意,雖然處理器會對指令進行重排序,但是它會保證程式最終結果會和程式碼順序執行結果相同,那麼它靠什麼保證的呢?再看下面一個例子:
1234 | int a = 10 ; //語句1 int r = 2 ; //語句2 a = a + 3 ; //語句3 r = a*a; //語句4 |
這段程式碼有4個語句,那麼可能的一個執行順序是:
那麼可不可能是這個執行順序呢: 語句2 語句1 語句4 語句3
不可能,因為處理器在進行重排序時是會考慮指令之間的資料依賴性,如果一個指令Instruction 2必須用到Instruction 1的結果,那麼處理器會保證Instruction 1會在Instruction 2之前執行。
雖然重排序不會影響單個執行緒內程式執行的結果,但是多執行緒呢?下面看一個例子:
12345678910 | //執行緒1: context = loadContext(); //語句1 inited = true ; //語句2 //執行緒2: while (!inited ){ sleep() } doSomethingwithconfig(context); |
上面程式碼中,由於語句1和語句2沒有資料依賴性,因此可能會被重排序。假如發生了重排序,線上程1執行過程中先執行語句2,而此是執行緒2會以為初始化工作已經完成,那麼就會跳出while迴圈,去執行doSomethingwithconfig(context)方法,而此時context並沒有被初始化,就會導致程式出錯。
從上面可以看出,指令重排序不會影響單個執行緒的執行,但是會影響到執行緒併發執行的正確性。
也就是說,要想併發程式正確地執行,必須要保證原子性、可見性以及有序性。只要有一個沒有被保證,就有可能會導致程式執行不正確。
3.Java中的有序性
在Java記憶體模型中,允許編譯器和處理器對指令進行重排序,但是重排序過程不會影響到單執行緒程式的執行,卻會影響到多執行緒併發執行的正確性。
在Java裡面,可以通過volatile關鍵字來保證一定的“有序性”。另外可以通過synchronized和Lock來保證有序性,很顯然,synchronized和Lock保證每個時刻是有一個執行緒執行同步程式碼,相當於是讓執行緒順序執行同步程式碼,自然就保證了有序性。
另外,Java記憶體模型具備一些先天的“有序性”,即不需要通過任何手段就能夠得到保證的有序性,這個通常也稱為 happens-before 原則。如果兩個操作的執行次序無法從happens-before原則推匯出來,那麼它們就不能保證它們的有序性,虛擬機器可以隨意地對它們進行重排序。
下面就來具體介紹下happens-before原則(先行發生原則):
①程式次序規則:一個執行緒內,按照程式碼順序,書寫在前面的操作先行發生於書寫在後面的操作
②鎖定規則:一個unLock操作先行發生於後面對同一個鎖的lock操作
③volatile變數規則:對一個變數的寫操作先行發生於後面對這個變數的讀操作
④傳遞規則:如果操作A先行發生於操作B,而操作B又先行發生於操作C,則可以得出操作A先行發生於操作C
⑤執行緒啟動規則:Thread物件的start()方法先行發生於此執行緒的每個一個動作
⑥執行緒中斷規則:對執行緒interrupt()方法的呼叫先行發生於被中斷執行緒的程式碼檢測到中斷事件的發生
⑦執行緒終結規則:執行緒中所有的操作都先行發生於執行緒的終止檢測,我們可以通過Thread.join()方法結束、Thread.isAlive()的返回值手段檢測到執行緒已經終止執行
⑧物件終結規則:一個物件的初始化完成先行發生於他的finalize()方法的開始
這8條規則中,前4條規則是比較重要的,後4條規則都是顯而易見的。
下面我們來解釋一下前4條規則:
對於程式次序規則來說,就是一段程式程式碼的執行在單個執行緒中看起來是有序的。注意,雖然這條規則中提到“書寫在前面的操作先行發生於書寫在後面的操作”,這個應該是程式看起來執行的順序是按照程式碼順序執行的,但是虛擬機器可能會對程式程式碼進行指令重排序。雖然進行重排序,但是最終執行的結果是與程式順序執行的結果一致的,它只會對不存在資料依賴性的指令進行重排序。因此,在單個執行緒中,程式執行看起來是有序執行的,這一點要注意理解。事實上,這個規則是用來保證程式在單執行緒中執行結果的正確性,但無法保證程式在多執行緒中執行的正確性。
第二條規則也比較容易理解,也就是說無論在單執行緒中還是多執行緒中,同一個鎖如果處於被鎖定的狀態,那麼必須先對鎖進行了釋放操作,後面才能繼續進行lock操作。
第三條規則是一條比較重要的規則。直觀地解釋就是,如果一個執行緒先去寫一個變數,然後一個執行緒去進行讀取,那麼寫入操作肯定會先行發生於讀操作。
第四條規則實際上就是體現happens-before原則具備傳遞性。
五、深入理解volatile關鍵字
1.volatile保證可見性
一旦一個共享變數(類的成員變數、類的靜態成員變數)被volatile修飾之後,那麼就具備了兩層語義:
1)保證了不同執行緒對這個變數進行操作時的可見性,即一個執行緒修改了某個變數的值,這新值對其他執行緒來說是立即可見的。
2)禁止進行指令重排序。
先看一段程式碼,假如執行緒1先執行,執行緒2後執行:
12345678 | //執行緒1 boolean stop = false ; while (!stop){ doSomething(); } //執行緒2 stop = true ; |
這段程式碼是很典型的一段程式碼,很多人在中斷執行緒時可能都會採用這種標記辦法。但是事實上,這段程式碼會完全執行正確麼?即一定會將執行緒中斷麼?不一定,也許在大多數時候,這個程式碼能夠把執行緒中斷,但是也有可能會導致無法中斷執行緒(雖然這個可能性很小,但是隻要一旦發生這種情況就會造成死迴圈了)。
下面解釋一下這段程式碼為何有可能導致無法中斷執行緒。在前面已經解釋過,每個執行緒在執行過程中都有自己的工作記憶體,那麼執行緒1在執行的時候,會將stop變數的值拷貝一份放在自己的工作記憶體當中。
那麼當執行緒2更改了stop變數的值之後,但是還沒來得及寫入主存當中,執行緒2轉去做其他事情了,那麼執行緒1由於不知道執行緒2對stop變數的更改,因此還會一直迴圈下去。
但是用volatile修飾之後就變得不一樣了:
第一:使用volatile關鍵字會強制將修改的值立即寫入主存;
第二:使用volatile關鍵字的話,當執行緒2進行修改時,會導致執行緒1的工作記憶體中快取變數stop的快取行無效(反映到硬體層的話,就是CPU的L1或者L2快取中對應的快取行無效);
第三:由於執行緒1的工作記憶體中快取變數stop的快取行無效,所以執行緒1再次讀取變數stop的值時會去主存讀取。
那麼線上程2修改stop值時(當然這裡包括2個操作,修改執行緒2工作記憶體中的值,然後將修改後的值寫入記憶體),會使得執行緒1的工作記憶體中快取變數stop的快取行無效,然後執行緒1讀取時,發現自己的快取行無效,它會等待快取行對應的主存地址被更新之後,然後去對應的主存讀取最新的值。
那麼執行緒1讀取到的就是最新的正確的值。
2.volatile不能確保原子性
下面看一個例子:
1234567891011121314151617181920212223 | public class Test { public volatile int inc = 0 ; public void increase() { inc++; } public static void main(String[] args) { final Test test = new Test(); for ( int i= 0 ;i< 10 ;i++){ new Thread(){ public void run() { for ( int j= 0 ;j< 1000 ;j++) test.increase(); }; }.start(); } while (Thread.activeCount()> 1 ) //保證前面的執行緒都執行完 Thread.yield(); System.out.println(test.inc); } } |
大家想一下這段程式的輸出結果是多少?也許有些朋友認為是10000。但是事實上執行它會發現每次執行結果都不一致,都是一個小於10000的數字。
可能有的朋友就會有疑問,不對啊,上面是對變數inc進行自增操作,由於volatile保證了可見性,那麼在每個執行緒中對inc自增完之後,在其他執行緒中都能看到修改後的值啊,所以有10個執行緒分別進行了1000次操作,那麼最終inc的值應該是1000*10=10000。
這裡面就有一個誤區了,volatile關鍵字能保證可見性沒有錯,但是上面的程式錯在沒能保證原子性。可見性只能保證每次讀取的是最新的值,但是volatile沒辦法保證對變數的操作的原子性。
在前面已經提到過,自增操作是不具備原子性的,它包括讀取變數的原始值、進行加1操作、寫入工作記憶體。那麼就是說自增操作的三個子操作可能會分割開執行,就有可能導致下面這種情況出現:
假如某個時刻變數inc的值為10,
執行緒1對變數進行自增操作,執行緒1先讀取了變數inc的原始值,然後執行緒1被阻塞了;
然後執行緒2對變數進行自增操作,執行緒2也去讀取變數inc的原始值,由於執行緒1只是對變數inc進行讀取操作,而沒有對變數進行修改操作,所以不會導致執行緒2的工作記憶體中快取變數inc的快取行無效,也不會導致主存中的值重新整理,所以執行緒2會直接去主存讀取inc的值,發現inc的值時10,然後進行加1操作,並把11寫入工作記憶體,最後寫入主存。
然後執行緒1接著進行加1操作,由於已經讀取了inc的值,注意此時線上程1的工作記憶體中inc的值仍然為10,所以執行緒1對inc進行加1操作後inc的值為11,然後將11寫入工作記憶體,最後寫入主存。
那麼兩個執行緒分別進行了一次自增操作後,inc只增加了1。
根源就在這裡,自增操作不是原子性操作,而且volatile也無法保證對變數的任何操作都是原子性的。
解決方案:可以通過synchronized或lock,進行加鎖,來保證操作的原子性。也可以通過AtomicInteger。
在java 1.5的java.util.concurrent.atomic包下提供了一些原子操作類,即對基本資料型別的 自增(加1操作),自減(減1操作)、以及加法操作(加一個數),減法操作(減一個數)進行了封裝,保證這些操作是原子性操作。atomic是利用CAS來實現原子性操作的(Compare And Swap),CAS實際上是利用處理器提供的CMPXCHG指令實現的,而處理器執行CMPXCHG指令是一個原子性操作。
3.volatile保證有序性
在前面提到volatile關鍵字能禁止指令重排序,所以volatile能在一定程度上保證有序性。
volatile關鍵字禁止指令重排序有兩層意思:
1)當程式執行到volatile變數的讀操作或者寫操作時,在其前面的操作的更改肯定全部已經進行,且結果已經對後面的操作可見;在其後面的操作肯定還沒有進行;
2)在進行指令優化時,不能將在對volatile變數的讀操作或者寫操作的語句放在其後面執行,也不能把volatile變數後面的語句放到其前面執行。
可能上面說的比較繞,舉個簡單的例子:
12345678 | //x、y為非volatile變數 //flag為volatile變數 x = 2 ; //語句1 y = 0 ; //語句2 flag = true ; //語句3 x = 4 ; //語句4 y = - 1 ; //語句5 |
由於flag變數為volatile變數,那麼在進行指令重排序的過程的時候,不會將語句3放到語句1、語句2前面,也不會講語句3放到語句4、語句5後面。但是要注意語句1和語句2的順序、語句4和語句5的順序是不作任何保證的。
並且volatile關鍵字能保證,執行到語句3時,語句1和語句2必定是執行完畢了的,且語句1和語句2的執行結果對語句3、語句4、語句5是可見的。
那麼我們回到前面舉的一個例子:
123456789 | //執行緒1: context = loadContext(); //語句1 inited = true ; //語句2 //執行緒2: while (!inited ){ sleep() } doSomethingwithconfig(context); |
前面舉這個例子的時候,提到有可能語句2會在語句1之前執行,那麼久可能導致context還沒被初始化,而執行緒2中就使用未初始化的context去進行操作,導致程式出錯。
這裡如果用volatile關鍵字對inited變數進行修飾,就不會出現這種問題了,因為當執行到語句2時,必定能保證context已經初始化完畢。
六、volatile的實現原理
1.可見性
處理器為了提高處理速度,不直接和記憶體進行通訊,而是將系統記憶體的資料獨到內部快取後再進行操作,但操作完後不知什麼時候會寫到記憶體。
如果對聲明瞭volatile變數進行寫操作時,JVM會向處理器傳送一條Lock字首的指令,將這個變數所在快取行的資料寫會到系統記憶體。 這一步確保瞭如果有其他執行緒對聲明瞭volatile變數進行修改,則立即更新主記憶體中資料。
但這時候其他處理器的快取還是舊的,所以在多處理器環境下,為了保證各個處理器快取一致,每個處理會通過嗅探在總線上傳播的資料來檢查 自己的快取是否過期,當處理器發現自己快取行對應的記憶體地址被修改了,就會將當前處理器的快取行設定成無效狀態,當處理器要對這個資料進行修改操作時,會強制重新從系統記憶體把資料讀到處理器快取裡。 這一步確保了其他執行緒獲得的聲明瞭volatile變數都是從主記憶體中獲取最新的。
2.有序性
Lock字首指令實際上相當於一個記憶體屏障(也成記憶體柵欄),它確保指令重排序時不會把其後面的指令排到記憶體屏障之前的位置,也不會把前面的指令排到記憶體屏障的後面;即在執行到記憶體屏障這句指令時,在它前面的操作已經全部完成。
七、volatile的應用場景
synchronized關鍵字是防止多個執行緒同時執行一段程式碼,那麼就會很影響程式執行效率,而volatile關鍵字在某些情況下效能要優於synchronized,但是要注意volatile關鍵字是無法替代synchronized關鍵字的,因為volatile關鍵字無法保證操作的原子性。通常來說,使用volatile必須具備以下2個條件:
1)對變數的寫操作不依賴於當前值
2)該變數沒有包含在具有其他變數的不變式中
下面列舉幾個Java中使用volatile的幾個場景。
①.狀態標記量
123456789 | volatile boolean flag = false ; //執行緒1 while (!flag){ doSomething(); } //執行緒2 public void setFlag() { flag = true ; } |
根據狀態標記,終止執行緒。
②.單例模式中的double check
1234567891011121314151617 | class Singleton{ private volatile static Singleton instance = null ; private Singleton() { } public static Singleton getInstance() { if (instance== null ) { synchronized (Singleton. class ) { if (instance== null ) instance = new Singleton(); } } return instance; } } |
為什麼要使用volatile 修飾instance?
主要在於instance = new Singleton()這句,這並非是一個原子操作,事實上在 JVM 中這句話大概做了下面 3 件事情:
1.給 instance 分配記憶體
2.呼叫 Singleton 的建構函式來初始化成員變數
3.將instance物件指向分配的記憶體空間(執行完這步 instance 就為非 null 了)。
但是在 JVM 的即時編譯器中存在指令重排序的優化。也就是說上面的第二步和第三步的順序是不能保證的,最終的執行順序可能是 1-2-3 也可能是 1-3-2。如果是後者,則在 3 執行完畢、2 未執行之前,被執行緒二搶佔了,這時 instance 已經是非 null 了(但卻沒有初始化),所以執行緒二會直接返回 instance,然後使用,然後順理成章地報錯。