深入理解volatile關鍵字

阿新 • • 發佈：2018-04-04

最新 bsp 發現聲明柵欄 AD ole 情況返回值

Java內存模型

想要理解volatile為什麽能確保可見性，就要先理解Java中的內存模型是什麽樣的。

Java內存模型規定了所有的變量都存儲在主內存中。每條線程中還有自己的工作內存，線程的工作內存中保存了被該線程所使用到的變量（這些變量是從主內存中拷貝而來）。線程對變量的所有操作（讀取，賦值）都必須在工作內存中進行。不同線程之間也無法直接訪問對方工作內存中的變量，線程間變量值的傳遞均需要通過主內存來完成。

基於此種內存模型，便產生了多線程編程中的數據“臟讀”等問題。

舉個簡單的例子：在java中，執行下面這個語句：

i  = 10++;

執行線程必須先在自己的工作線程中對變量i所在的緩存行進行賦值操作，然後再寫入主存當中。而不是直接將數值10寫入主存當中。

比如同時有2個線程執行這段代碼，假如初始時i的值為10，那麽我們希望兩個線程執行完之後i的值變為12。但是事實會是這樣嗎？

可能存在下面一種情況：初始時，兩個線程分別讀取i的值存入各自所在的工作內存當中，然後線程1進行加1操作，然後把i的最新值11寫入到內存。此時線程2的工作內存當中i的值還是10，進行加1操作之後，i的值為11，然後線程2把i的值寫入內存。

最終結果i的值是11，而不是12。這就是著名的緩存一致性問題。通常稱這種被多個線程訪問的變量為共享變量。

那麽如何確保共享變量在多線程訪問時能夠正確輸出結果呢？

在解決這個問題之前，我們要先了解並發編程的三大概念：原子性，有序性，可見性。

二、原子性

1.定義

原子性：即一個操作或者多個操作要麽全部執行並且執行的過程不會被任何因素打斷，要麽就都不執行。

2.實例

一個很經典的例子就是銀行賬戶轉賬問題：

比如從賬戶A向賬戶B轉1000元，那麽必然包括2個操作：從賬戶A減去1000元，往賬戶B加上1000元。

試想一下，如果這2個操作不具備原子性，會造成什麽樣的後果。假如從賬戶A減去1000元之後，操作突然中止。這樣就會導致賬戶A雖然減去了1000元，但是賬戶B沒有收到這個轉過來的1000元。

所以這2個操作必須要具備原子性才能保證不出現一些意外的問題。

同樣地反映到並發編程中會出現什麽結果呢？

舉個最簡單的例子，大家想一下假如為一個32位的變量賦值過程不具備原子性的話，會發生什麽後果？

i = 9;

假若一個線程執行到這個語句時，我暫且假設為一個32位的變量賦值包括兩個過程：為低16位賦值，為高16位賦值。

那麽就可能發生一種情況：當將低16位數值寫入之後，突然被中斷，而此時又有一個線程去讀取i的值，那麽讀取到的就是錯誤的數據。

3.Java中的原子性

在Java中，對基本數據類型的變量的讀取和賦值操作是原子性操作，即這些操作是不可被中斷的，要麽執行，要麽不執行。

上面一句話雖然看起來簡單，但是理解起來並不是那麽容易。看下面一個例子i：

請分析以下哪些操作是原子性操作：

x = 10;         //語句1
y = x;         //語句2
x++;           //語句3
x = x + 1;     //語句4

咋一看，可能會說上面的4個語句中的操作都是原子性操作。其實只有語句1是原子性操作，其他三個語句都不是原子性操作。

語句1是直接將數值10賦值給x，也就是說線程執行這個語句的會直接將數值10寫入到工作內存中。

語句2實際上包含2個操作，它先要去讀取x的值，再將x的值寫入工作內存，雖然讀取x的值以及將x的值寫入工作內存這2個操作都是原子性操作，但是合起來就不是原子性操作了。

同樣的，x++和 x = x+1包括3個操作：讀取x的值，進行加1操作，寫入新的值。

所以上面4個語句只有語句1的操作具備原子性。

也就是說，只有簡單的讀取、賦值（而且必須是將數字賦值給某個變量，變量之間的相互賦值不是原子操作）才是原子操作。

從上面可以看出，Java內存模型只保證了基本讀取和賦值是原子性操作，如果要實現更大範圍操作的原子性，可以通過synchronized和Lock來實現。由於synchronized和Lock能夠保證任一時刻只有一個線程執行該代碼塊，那麽自然就不存在原子性問題了，從而保證了原子性。

關於synchronized和Lock的使用，參考：關於synchronized和ReentrantLock之多線程同步詳解

三、可見性

1.定義

可見性是指當多個線程訪問同一個變量時，一個線程修改了這個變量的值，其他線程能夠立即看得到修改的值。

2.實例

舉個簡單的例子，看下面這段代碼：

//線程1執行的代碼
int i = 0;
i = 10;

//線程2執行的代碼
j = i;

由上面的分析可知，當線程1執行 i =10這句時，會先把i的初始值加載到工作內存中，然後賦值為10，那麽在線程1的工作內存當中i的值變為10了，卻沒有立即寫入到主存當中。

此時線程2執行 j = i，它會先去主存讀取i的值並加載到線程2的工作內存當中，註意此時內存當中i的值還是0，那麽就會使得j的值為0，而不是10.

這就是可見性問題，線程1對變量i修改了之後，線程2沒有立即看到線程1修改的值。

3.Java中的可見性

對於可見性，Java提供了volatile關鍵字來保證可見性。

當一個共享變量被volatile修飾時，它會保證修改的值會立即被更新到主存，當有其他線程需要讀取時，它會去內存中讀取新值。

而普通的共享變量不能保證可見性，因為普通共享變量被修改之後，什麽時候被寫入主存是不確定的，當其他線程去讀取時，此時內存中可能還是原來的舊值，因此無法保證可見性。

另外，通過synchronized和Lock也能夠保證可見性，synchronized和Lock能保證同一時刻只有一個線程獲取鎖然後執行同步代碼，並且在釋放鎖之前會將對變量的修改刷新到主存當中。因此可以保證可見性。

四、有序性

1.定義

有序性：即程序執行的順序按照代碼的先後順序執行。

2.實例

舉個簡單的例子，看下面這段代碼：

int i = 0;              

boolean flag = false;

i = 1;                //語句1  
flag = true;          //語句2

上面代碼定義了一個int型變量，定義了一個boolean類型變量，然後分別對兩個變量進行賦值操作。從代碼順序上看，語句1是在語句2前面的，那麽JVM在真正執行這段代碼的時候會保證語句1一定會在語句2前面執行嗎？不一定，為什麽呢？這裏可能會發生指令重排序（Instruction Reorder）。

下面解釋一下什麽是指令重排序，一般來說，處理器為了提高程序運行效率，可能會對輸入代碼進行優化，它不保證程序中各個語句的執行先後順序同代碼中的順序一致，但是它會保證程序最終執行結果和代碼順序執行的結果是一致的。

比如上面的代碼中，語句1和語句2誰先執行對最終的程序結果並沒有影響，那麽就有可能在執行過程中，語句2先執行而語句1後執行。

但是要註意，雖然處理器會對指令進行重排序，但是它會保證程序最終結果會和代碼順序執行結果相同，那麽它靠什麽保證的呢？再看下面一個例子：

int a = 10;    //語句1
int r = 2;    //語句2
a = a + 3;    //語句3
r = a*a;     //語句4

這段代碼有4個語句，那麽可能的一個執行順序是：

那麽可不可能是這個執行順序呢：語句2 語句1 語句4 語句3

不可能，因為處理器在進行重排序時是會考慮指令之間的數據依賴性，如果一個指令Instruction 2必須用到Instruction 1的結果，那麽處理器會保證Instruction 1會在Instruction 2之前執行。

雖然重排序不會影響單個線程內程序執行的結果，但是多線程呢？下面看一個例子：

//線程1:

context = loadContext();   //語句1
inited = true;             //語句2

 //線程2:
while(!inited ){
   sleep()
}
doSomethingwithconfig(context);

上面代碼中，由於語句1和語句2沒有數據依賴性，因此可能會被重排序。假如發生了重排序，在線程1執行過程中先執行語句2，而此是線程2會以為初始化工作已經完成，那麽就會跳出while循環，去執行doSomethingwithconfig(context)方法，而此時context並沒有被初始化，就會導致程序出錯。

從上面可以看出，指令重排序不會影響單個線程的執行，但是會影響到線程並發執行的正確性。

也就是說，要想並發程序正確地執行，必須要保證原子性、可見性以及有序性。只要有一個沒有被保證，就有可能會導致程序運行不正確。

3.Java中的有序性

在Java內存模型中，允許編譯器和處理器對指令進行重排序，但是重排序過程不會影響到單線程程序的執行，卻會影響到多線程並發執行的正確性。

在Java裏面，可以通過volatile關鍵字來保證一定的“有序性”。另外可以通過synchronized和Lock來保證有序性，很顯然，synchronized和Lock保證每個時刻是有一個線程執行同步代碼，相當於是讓線程順序執行同步代碼，自然就保證了有序性。

另外，Java內存模型具備一些先天的“有序性”，即不需要通過任何手段就能夠得到保證的有序性，這個通常也稱為 happens-before 原則。如果兩個操作的執行次序無法從happens-before原則推導出來，那麽它們就不能保證它們的有序性，虛擬機可以隨意地對它們進行重排序。

下面就來具體介紹下happens-before原則（先行發生原則）：

①程序次序規則：一個線程內，按照代碼順序，書寫在前面的操作先行發生於書寫在後面的操作

②鎖定規則：一個unLock操作先行發生於後面對同一個鎖的lock操作

③volatile變量規則：對一個變量的寫操作先行發生於後面對這個變量的讀操作

④傳遞規則：如果操作A先行發生於操作B，而操作B又先行發生於操作C，則可以得出操作A先行發生於操作C

⑤線程啟動規則：Thread對象的start()方法先行發生於此線程的每個一個動作

⑥線程中斷規則：對線程interrupt()方法的調用先行發生於被中斷線程的代碼檢測到中斷事件的發生

⑦線程終結規則：線程中所有的操作都先行發生於線程的終止檢測，我們可以通過Thread.join()方法結束、Thread.isAlive()的返回值手段檢測到線程已經終止執行

⑧對象終結規則：一個對象的初始化完成先行發生於他的finalize()方法的開始

這8條規則中，前4條規則是比較重要的，後4條規則都是顯而易見的。

下面我們來解釋一下前4條規則：

對於程序次序規則來說，就是一段程序代碼的執行在單個線程中看起來是有序的。註意，雖然這條規則中提到“書寫在前面的操作先行發生於書寫在後面的操作”，這個應該是程序看起來執行的順序是按照代碼順序執行的，但是虛擬機可能會對程序代碼進行指令重排序。雖然進行重排序，但是最終執行的結果是與程序順序執行的結果一致的，它只會對不存在數據依賴性的指令進行重排序。因此，在單個線程中，程序執行看起來是有序執行的，這一點要註意理解。事實上，這個規則是用來保證程序在單線程中執行結果的正確性，但無法保證程序在多線程中執行的正確性。

第二條規則也比較容易理解，也就是說無論在單線程中還是多線程中，同一個鎖如果處於被鎖定的狀態，那麽必須先對鎖進行了釋放操作，後面才能繼續進行lock操作。

第三條規則是一條比較重要的規則。直觀地解釋就是，如果一個線程先去寫一個變量，然後一個線程去進行讀取，那麽寫入操作肯定會先行發生於讀操作。

第四條規則實際上就是體現happens-before原則具備傳遞性。

五、深入理解volatile關鍵字

1.volatile保證可見性

一旦一個共享變量（類的成員變量、類的靜態成員變量）被volatile修飾之後，那麽就具備了兩層語義：

1）保證了不同線程對這個變量進行操作時的可見性，即一個線程修改了某個變量的值，這新值對其他線程來說是立即可見的。

2）禁止進行指令重排序。

先看一段代碼，假如線程1先執行，線程2後執行：

//線程1
boolean stop = false;
while(!stop){
    doSomething();
}

//線程2
stop = true;

這段代碼是很典型的一段代碼，很多人在中斷線程時可能都會采用這種標記辦法。但是事實上，這段代碼會完全運行正確麽？即一定會將線程中斷麽？不一定，也許在大多數時候，這個代碼能夠把線程中斷，但是也有可能會導致無法中斷線程（雖然這個可能性很小，但是只要一旦發生這種情況就會造成死循環了）。

下面解釋一下這段代碼為何有可能導致無法中斷線程。在前面已經解釋過，每個線程在運行過程中都有自己的工作內存，那麽線程1在運行的時候，會將stop變量的值拷貝一份放在自己的工作內存當中。

那麽當線程2更改了stop變量的值之後，但是還沒來得及寫入主存當中，線程2轉去做其他事情了，那麽線程1由於不知道線程2對stop變量的更改，因此還會一直循環下去。

但是用volatile修飾之後就變得不一樣了：

第一：使用volatile關鍵字會強制將修改的值立即寫入主存；

第二：使用volatile關鍵字的話，當線程2進行修改時，會導致線程1的工作內存中緩存變量stop的緩存行無效（反映到硬件層的話，就是CPU的L1或者L2緩存中對應的緩存行無效）；

第三：由於線程1的工作內存中緩存變量stop的緩存行無效，所以線程1再次讀取變量stop的值時會去主存讀取。

那麽在線程2修改stop值時（當然這裏包括2個操作，修改線程2工作內存中的值，然後將修改後的值寫入內存），會使得線程1的工作內存中緩存變量stop的緩存行無效，然後線程1讀取時，發現自己的緩存行無效，它會等待緩存行對應的主存地址被更新之後，然後去對應的主存讀取最新的值。

那麽線程1讀取到的就是最新的正確的值。

2.volatile不能確保原子性

下面看一個例子：

public class Test {
    public volatile int inc = 0;

    public void increase() {
        inc++;
    }

    public static void main(String[] args) {
        final Test test = new Test();
        for(int i=0;i<10;i++){
            new Thread(){
                public void run() {
                    for(int j=0;j<1000;j++)
                        test.increase();
                };
            }.start();
        }

        while(Thread.activeCount()>1)  //保證前面的線程都執行完
            Thread.yield();
        System.out.println(test.inc);
    }
}

大家想一下這段程序的輸出結果是多少？也許有些朋友認為是10000。但是事實上運行它會發現每次運行結果都不一致，都是一個小於10000的數字。

可能有的朋友就會有疑問，不對啊，上面是對變量inc進行自增操作，由於volatile保證了可見性，那麽在每個線程中對inc自增完之後，在其他線程中都能看到修改後的值啊，所以有10個線程分別進行了1000次操作，那麽最終inc的值應該是1000*10=10000。

這裏面就有一個誤區了，volatile關鍵字能保證可見性沒有錯，但是上面的程序錯在沒能保證原子性。可見性只能保證每次讀取的是最新的值，但是volatile沒辦法保證對變量的操作的原子性。

在前面已經提到過，自增操作是不具備原子性的，它包括讀取變量的原始值、進行加1操作、寫入工作內存。那麽就是說自增操作的三個子操作可能會分割開執行，就有可能導致下面這種情況出現：

假如某個時刻變量inc的值為10，

線程1對變量進行自增操作，線程1先讀取了變量inc的原始值，然後線程1被阻塞了；

然後線程2對變量進行自增操作，線程2也去讀取變量inc的原始值，由於線程1只是對變量inc進行讀取操作，而沒有對變量進行修改操作，所以不會導致線程2的工作內存中緩存變量inc的緩存行無效，也不會導致主存中的值刷新，所以線程2會直接去主存讀取inc的值，發現inc的值時10，然後進行加1操作，並把11寫入工作內存，最後寫入主存。

然後線程1接著進行加1操作，由於已經讀取了inc的值，註意此時在線程1的工作內存中inc的值仍然為10，所以線程1對inc進行加1操作後inc的值為11，然後將11寫入工作內存，最後寫入主存。

那麽兩個線程分別進行了一次自增操作後，inc只增加了1。

根源就在這裏，自增操作不是原子性操作，而且volatile也無法保證對變量的任何操作都是原子性的。

解決方案：可以通過synchronized或lock，進行加鎖，來保證操作的原子性。也可以通過AtomicInteger。

在java 1.5的java.util.concurrent.atomic包下提供了一些原子操作類，即對基本數據類型的自增（加1操作），自減（減1操作）、以及加法操作（加一個數），減法操作（減一個數）進行了封裝，保證這些操作是原子性操作。atomic是利用CAS來實現原子性操作的（Compare And Swap），CAS實際上是利用處理器提供的CMPXCHG指令實現的，而處理器執行CMPXCHG指令是一個原子性操作。

3.volatile保證有序性

在前面提到volatile關鍵字能禁止指令重排序，所以volatile能在一定程度上保證有序性。

volatile關鍵字禁止指令重排序有兩層意思：

1）當程序執行到volatile變量的讀操作或者寫操作時，在其前面的操作的更改肯定全部已經進行，且結果已經對後面的操作可見；在其後面的操作肯定還沒有進行；

2）在進行指令優化時，不能將在對volatile變量的讀操作或者寫操作的語句放在其後面執行，也不能把volatile變量後面的語句放到其前面執行。

可能上面說的比較繞，舉個簡單的例子：

//x、y為非volatile變量
//flag為volatile變量

x = 2;        //語句1
y = 0;        //語句2
flag = true;  //語句3
x = 4;         //語句4
y = -1;       //語句5

由於flag變量為volatile變量，那麽在進行指令重排序的過程的時候，不會將語句3放到語句1、語句2前面，也不會講語句3放到語句4、語句5後面。但是要註意語句1和語句2的順序、語句4和語句5的順序是不作任何保證的。

並且volatile關鍵字能保證，執行到語句3時，語句1和語句2必定是執行完畢了的，且語句1和語句2的執行結果對語句3、語句4、語句5是可見的。

那麽我們回到前面舉的一個例子：

//線程1:
context = loadContext();   //語句1
inited = true;             //語句2

//線程2:
while(!inited ){
  sleep()
}
doSomethingwithconfig(context);

前面舉這個例子的時候，提到有可能語句2會在語句1之前執行，那麽久可能導致context還沒被初始化，而線程2中就使用未初始化的context去進行操作，導致程序出錯。

這裏如果用volatile關鍵字對inited變量進行修飾，就不會出現這種問題了，因為當執行到語句2時，必定能保證context已經初始化完畢。

六、volatile的實現原理

1.可見性

處理器為了提高處理速度，不直接和內存進行通訊，而是將系統內存的數據獨到內部緩存後再進行操作，但操作完後不知什麽時候會寫到內存。

如果對聲明了volatile變量進行寫操作時，JVM會向處理器發送一條Lock前綴的指令，將這個變量所在緩存行的數據寫會到系統內存。這一步確保了如果有其他線程對聲明了volatile變量進行修改，則立即更新主內存中數據。

但這時候其他處理器的緩存還是舊的，所以在多處理器環境下，為了保證各個處理器緩存一致，每個處理會通過嗅探在總線上傳播的數據來檢查自己的緩存是否過期，當處理器發現自己緩存行對應的內存地址被修改了，就會將當前處理器的緩存行設置成無效狀態，當處理器要對這個數據進行修改操作時，會強制重新從系統內存把數據讀到處理器緩存裏。這一步確保了其他線程獲得的聲明了volatile變量都是從主內存中獲取最新的。

2.有序性

Lock前綴指令實際上相當於一個內存屏障（也成內存柵欄），它確保指令重排序時不會把其後面的指令排到內存屏障之前的位置，也不會把前面的指令排到內存屏障的後面；即在執行到內存屏障這句指令時，在它前面的操作已經全部完成。

七、volatile的應用場景

synchronized關鍵字是防止多個線程同時執行一段代碼，那麽就會很影響程序執行效率，而volatile關鍵字在某些情況下性能要優於synchronized，但是要註意volatile關鍵字是無法替代synchronized關鍵字的，因為volatile關鍵字無法保證操作的原子性。通常來說，使用volatile必須具備以下2個條件：

1）對變量的寫操作不依賴於當前值

2）該變量沒有包含在具有其他變量的不變式中

下面列舉幾個Java中使用volatile的幾個場景。

①.狀態標記量

volatile boolean flag = false;
 //線程1
while(!flag){
    doSomething();
}
  //線程2
public void setFlag() {
    flag = true;
}

根據狀態標記，終止線程。

②.單例模式中的double check

class Singleton{
    private volatile static Singleton instance = null;

    private Singleton() {

    }

    public static Singleton getInstance() {
        if(instance==null) {
            synchronized (Singleton.class) {
                if(instance==null)
                    instance = new Singleton();
            }
        }
        return instance;
    }
}

為什麽要使用volatile 修飾instance？

主要在於instance = new Singleton()這句，這並非是一個原子操作，事實上在 JVM 中這句話大概做了下面 3 件事情:

1.給 instance 分配內存

2.調用 Singleton 的構造函數來初始化成員變量

3.將instance對象指向分配的內存空間（執行完這步 instance 就為非 null 了）。

但是在 JVM 的即時編譯器中存在指令重排序的優化。也就是說上面的第二步和第三步的順序是不能保證的，最終的執行順序可能是 1-2-3 也可能是 1-3-2。如果是後者，則在 3 執行完畢、2 未執行之前，被線程二搶占了，這時 instance 已經是非 null 了（但卻沒有初始化），所以線程二會直接返回 instance，然後使用，然後順理成章地報錯。

深入理解volatile關鍵字

最新 bsp 發現聲明柵欄 AD ole 情況返回值 Java內存模型想要理解volatile為什麽能確保可見性，就要先理解Java中的內存模型是什麽樣的。 Java內存模型規定了所有的變量都存儲在主內存中。每條線程中還有自己的工作內存，線程的工作內存中保存了被該線

深入理解volatile關鍵字

Java內存模型

二、原子性

1.定義

2.實例

3.Java中的原子性

三、可見性

1.定義

2.實例

3.Java中的可見性

四、有序性

1.定義

2.實例

3.Java中的有序性

下面就來具體介紹下happens-before原則（先行發生原則）：

五、深入理解volatile關鍵字

1.volatile保證可見性

2.volatile不能確保原子性

3.volatile保證有序性

六、volatile的實現原理

1.可見性

2.有序性

七、volatile的應用場景

為什麽要使用volatile 修飾instance？

相關推薦