JUC中的原子操作類及其原理

阿新 • • 發佈：2020-01-30

　　昨天簡單的看了看Unsafe的使用，今天我們看看JUC中的原子類是怎麼使用Unsafe的，以及分析一下其中的原理！

一.簡單使用AtomicLong

　　還記的上一篇部落格中我們使用了volatile關鍵字修飾了一個int型別的變數，然後兩個執行緒，分別對這個變數進行10000次+1操作，最後結果不是20000，現在我們改成AtomicLong之後，你會發現結果始終都是20000了！有興趣的可以試試，程式碼如下

package com.example.demo.study;

import java.util.concurrent.atomic.AtomicLong;

public class Study0127 {

    //這是一個全域性變數,注意，這裡使用了一個原子類AtomicLong
    public AtomicLong num = new AtomicLong();

    //每次呼叫這個方法，都會對全域性變數加一操作，執行10000次
    public void sum() {
        for (int i = 0; i < 10000; i++) {
            //使用了原子類的incrementAndGet方法，其實就是把num++封裝成原子操作
            num.incrementAndGet();
            System.out.println("當前num的值為num= "+ num);
        }
    }

    public static void main(String[] args) throws InterruptedException {
        Study0127 demo = new Study0127();
        //下面就是新建兩個執行緒,分別呼叫一次sum方法
        new Thread(new Runnable() {
            @Override
            public void run() {
                demo.sum();
            }
        }).start();

        new Thread(new Runnable() {

            @Override
            public void run() {
                demo.sum();
            }
        }).start();    
    }
}

二.走近AtomicLong類

　　在java中JDK 1.5之後，就出現了一個包，簡稱JUC併發包，全稱就是java.util .concurrent，其中我們應該聽說過一個類ConcurrentHashMap，這個map挺有意思的，有興趣可以看看原始碼！還有很多併發時候需要使用的類比如AtomicInteger，AtomicLong，AtomicBoolean等等，其實都差不多，這次我們就簡單看看AtomicLong，其他的幾個類也差不多

public class AtomicLong extends Number implements java.io.Serializable {
    
    //獲取Unsafe物件，上篇部落格說了我們自己的類中不能使用這種方式的原因，但是官方的這個類為什麼可以這樣獲取呢？因為本類AtomicLong
    //就是在rt.jar包下面，本類就是用Bootstrap類載入的，所以就可以用這種方式
    private static final Unsafe unsafe = Unsafe.getUnsafe();
    //value這個欄位的偏移量
    private static final long valueOffset;

    //判斷jvm是否支援long型別的CAS操作
    static final boolean VM_SUPPORTS_LONG_CAS = VMSupportsCS8();
    private static native boolean VMSupportsCS8();

    static {
        try {
            valueOffset = unsafe.objectFieldOffset
                (AtomicLong.class.getDeclaredField("value"));
        } catch (Exception ex) { throw new Error(ex); }
    }
    //這裡用了volatile使的多執行緒下可見性，一定要分清楚原子性和可見性啊
    private volatile long value;

    //兩個構造器不多說
    public AtomicLong() {
    }
    public AtomicLong(long initialValue) {
        value = initialValue;
    }

　　然後我們看看AtomicLong的+1操作，可以看到使用的還是unsafe這個類，只需要看看getAndAddLong方法就可以了

　　方法getAndAddLong裡面就是進行了CAS操作，可以看成如果同時有多個執行緒都呼叫incrementAndGet方法進行+1，那麼同一時間只有一個執行緒會去進行操作，而其他的會不斷的使用CAS去嘗試+1，每次嘗試的時候都會去主記憶體中獲取最新的值；

 public final long getAndAddLong(Object o, long offset, long delta) {
        long v;
        do {
 
　　　　//這個方法就是重新獲取主記憶體的值，因為使用了volatile修飾了那個變數，所以快取就沒用了
            v = getLongVolatile(o, offset);
　　　　//這裡就是一個dowhile無限迴圈，多個執行緒不斷的呼叫compareAndSwapLong方法去設定值，其實就是CAS，沒什麼特別好說的吧，
　　　　//當某個執行緒CAS成功就跳出這個迴圈，否則就一直在迴圈不斷的嘗試，這也是CAS和執行緒阻塞的區別
        } while (!compareAndSwapLong(o, offset, v, v + delta));
        return v;
    }

//這個CAS方法看不到，c實現的
public final native boolean compareAndSwapLong(Object o, long offset,long expected,long x);

　　有興趣的可以看看AtomicLong的其他方法，很多都一樣，CAS是核心

三.CAS的不足以及認識LongAdder

　　從上面的例子中，我們可以知道在多執行緒下使用AtomicLong類的時候，同一個時刻使用那個共享變數的只能是一個執行緒，其他的執行緒都是在無限迴圈，這種迴圈也是需要消耗效能的，如果執行緒比較多，很多的執行緒都在各自的無限迴圈中，或者叫做多個執行緒都在自旋；每個執行緒都在自旋無數次真的是比較坑，比較消耗效能，我們可以想辦法自旋一定的次數，執行緒就結束運行了，有興趣的可以瞭解一下自旋鎖，其實就是這麼一個原理，很容易，哈哈哈！

　　在JDK8之後，提供了一個更好的類取代AtomicLong，那就是LongAdder，上面說過同一時間只有一個執行緒在使用那個共享變數，其他的執行緒都在自旋，那麼如果可以把這個共享變數拆開成多個部分，那麼是不是可以多個執行緒同時可以去操作呢？然後操作完之後再綜合起來，有點分治法的思想，分而治之，最後綜合起來。

　　那麼我們怎麼把那個共享變數拆成多個部分呢？

　　在LongAdder中是這樣處理的，把那個變數拆成一個base（這個是long型別的，初始值為0）和一個Cell（這個裡面封裝了一個long型別的值，初始值為0），每個執行緒只會去競爭很多Cell就行了，最後把多個Cell中的值和base累加起來就是最終結果；而且一個執行緒如果沒有競爭到Cell之後不會傻傻的自旋，直接想辦法去競爭下一個Cell；

　　下圖所示

四.簡單使用LongAdder

　　用法其實和AtomicLong差不多，有興趣的可以試試，最後的結果始終都是20000

package com.example.demo.study;

import java.util.concurrent.atomic.LongAdder;

public class Study0127 {

    //這裡使用LongAdder類
    public LongAdder num = new LongAdder();

    //每次呼叫這個方法，都會對全域性變數加一操作，執行10000次
    public void sum() {
        for (int i = 0; i < 10000; i++) {
            //LongAdder類的自增操作，相當於i++
            num.increment();
            System.out.println("當前num的值為num= "+ num);
        }
    }

    public static void main(String[] args) throws InterruptedException {
        Study0127 demo = new Study0127();
        //下面就是新建兩個執行緒,分別呼叫一次sum方法
        new Thread(new Runnable() {
            @Override
            public void run() {
                demo.sum();
            }
        }).start();

        new Thread(new Runnable() {

            @Override
            public void run() {
                demo.sum();
            }
        }).start();    
    }
}

五.走進LongAdder

　　從上面可以看到base只能是一個，而Cell可能有多個，而且Cell太多了也是很佔記憶體的，所以一開始的時候不會建立Cell，只有在需要時才建立，也叫做惰性載入。

　　我們可以知道LongAdder是繼承自Striped64這個類的

　　而Striped64類中有三個欄位，cells陣列用於存放多個Cell，一個是base不多說，還有一個cellsBusy用來實現自旋鎖，狀態只能是0或1(0表示Cell陣列沒有被初始化和擴容，也沒有正在建立Cell元素，反之則為1)，在建立Cell，初始化Cell陣列或者擴容Cell陣列的時候，就會用到這個欄位，保證同一時刻只有一個執行緒可以進行其中之一的操作。

　　1.我們簡單看看Cell的結構

　　　　從下面程式碼中可以很清楚的看到所謂的Cell就是對一個long型別變數的CAS操作

@sun.misc.Contended //這個註解的作用是為了避免偽共享，至於什麼偽共享，後面有機會再說說
static final class Cell {
    //每個Cell類中就是這個宣告的變數後期要進行累加的
    volatile long value;
    //建構函式
    Cell(long x) { value = x; }
    //Unsafe物件
    private static final sun.misc.Unsafe UNSAFE;
    //value的偏移量
    private static final long valueOffset;
    //這個靜態程式碼塊中就是獲取Unsafe物件和偏移量的
    static {
        try {
            UNSAFE = sun.misc.Unsafe.getUnsafe();
            Class<?> ak = Cell.class;
            valueOffset = UNSAFE.objectFieldOffset
                (ak.getDeclaredField("value"));
        } catch (Exception e) {
            throw new Error(e);
        }
    }
     //CAS操作，沒什麼好說的
    final boolean cas(long cmp, long val) {
        return UNSAFE.compareAndSwapLong(this, valueOffset, cmp, val);
    }
}

　　2.LongAdder類自增方法increment()

　　我們可以看到increment()方法其實就是呼叫了add方法，我們需要關注add方法幹了一些什麼；

 public void add(long x) {
    Cell[] as; long b, v; int m; Cell a;
    //這裡的cells是父類Striped64中的，不為空的話就儲存到as中，然後呼叫casBase方法，就是CAS給base更新為base+x,也就是每次都新增x，
    //在這裡由於add(1L)傳入的引數是1，也就是每次就是加一
    //如果CAS成功之後就不說了，就完成操作了，如果CAS失敗，則進入到裡面去
    if ((as = cells) != null || !casBase(b = base, b + x)) {
        boolean uncontended = true;
        //這個if判斷條件賊長，我們把這幾個條件分為1，2，3，4部分，前三部分都是用於決定執行緒應該訪問Cell陣列中哪一個Cell元素，最後一個部分用於更新Cell的值
        //如果第1，2，3部分都不滿足，也就是說Cell陣列存在而且已經找到了確定的Cell元素，那就到第四部分，更新對應的Cell中的值（在Cell類中的cas方法已經看過了）
        //如果第1，2，3部分滿足其中一個，那也就是說Cell陣列根本就不存在或者執行緒找不到對應的Cell，就執行longAccumulate方法
        if (as == null || (m = as.length - 1) < 0 || (a = as[getProbe() & m]) == null || !(uncontended = a.cas(v = a.value, v + x)))
            //後面仔細看看這個方法，這是對Cell陣列的初始化和擴容，很有意思
            longAccumulate(x, null, uncontended);
    }
}

//一個簡單的CAS操作
final boolean casBase(long cmp, long val) {
    return UNSAFE.compareAndSwapLong(this, BASE, cmp, val);
}

　　對於上面的，有興趣的可以看看是怎麼找到指定的Cell的，在上面的a = as[getProbe() & m]中，其中m=陣列的長度-1，其實這裡也是一個取餘的運算，而getProbe()這個方法是用於獲取當前執行緒的threadLocalRandomProb(當前本地執行緒探測值，初始值為0)，其實也就是一個隨機數啊，然後對陣列的長度取餘得到的就是對應的陣列的索引，首次呼叫這個方法是陣列的第一個元素，如果陣列的第一個元素為null，那麼就說明沒有找到對應的Cell；

　　對於取餘運算，舉個簡單的例子吧，我也有點忘記了，比如隨機數9要對4進行取餘，我們可以9&(4-1)=9&3=1001&0011=1，利用位運算取餘瞭解一下；

　　現在我們重點看看longAccumulate方法，程式碼比較長，單獨提取出來看看

　　3.longAccumulate方法

//此方法是對Cell陣列的初始化和擴容，注意有個形參LongBinaryOperator，這是JDK8新增的函數語言程式設計的介面，函式簽名為(T,T)->T,這裡傳進來的是null
final void longAccumulate(long x, LongBinaryOperator fn, boolean wasUncontended) {
    int h;
    //初始化當前執行緒的threadLocalRandomProbd的值，也就是生成一個隨機數
    if ((h = getProbe()) == 0) {
        ThreadLocalRandom.current(); // force initialization
        h = getProbe();
        wasUncontended = true;
    }
    boolean collide = false;                // True if last slot nonempty
    for (;;) {
        Cell[] as; Cell a; int n; long v;
        //這裡表示初始化完畢了
        if ((as = cells) != null && (n = as.length) > 0) {
            //這裡表示隨機數和陣列大小取餘，得到的結果就是當前執行緒要匹配到的Cell元素的索引，如果索引對應在Cell陣列中的元素為null，就新增一個Cell物件扔進去
            if ((a = as[(n - 1) & h]) == null) {
                //cellsBusy為0，表示當前Cell沒有進行擴容、初始化操作或者正在建立Cell等操作，那麼當前執行緒可以對這個Cell陣列為所欲為
                if (cellsBusy == 0) {       // Try to attach new Cell
                    Cell r = new Cell(x);   // Optimistically create
                    //看下面的Cell陣列初始化，說的很清楚，主要是設定cellsBusy為1，然後將當前執行緒匹配到的Cell設定為新建立的Cell物件
                    if (cellsBusy == 0 && casCellsBusy()) {
                        boolean created = false;
                        try {               // Recheck under lock
                            Cell[] rs; int m, j;
                            if ((rs = cells) != null &&
                                (m = rs.length) > 0 &&
                                rs[j = (m - 1) & h] == null) {
                                rs[j] = r;
                                created = true;
                            }
                        } finally {
                            //將cellsBusy重置為0，表示此時其他執行緒又可以對Cell陣列為所欲為了
                            cellsBusy = 0;
                        }
                        if (created)
                            break;
                        continue;           // Slot is now non-empty
                    }
                }
                collide = false;
            }


            else if (!wasUncontended)       // CAS already known to fail
                wasUncontended = true;      // Continue after rehash

            //Cell元素存在就執行CAS更新Cell中的值，這裡fn是形參為null
            else if (a.cas(v = a.value, ((fn == null) ? v + x :
                                            fn.applyAsLong(v, x))))
                break;



            //當Cell陣列元素個數大於CPU的個數
            else if (n >= NCPU || cells != as)
                collide = false;            // At max size or stale
            //是否有衝突
            else if (!collide)
                collide = true;
            //擴容Cell陣列，和上面兩個else if一起看
            //如果當前Cell陣列元素沒有達到CPU個數而且有衝突就新型擴容，擴容的數量是原來的兩倍Cell[] rs = new Cell[n << 1];，為什麼要和CPU個數比較呢？
            //因為當Cell陣列元素和CPU個數相同的時候，效率是最高的，因為每一個執行緒都是一個CPU來執行，再來修改其中其中一個Cell中的值
            //這裡還是利用cellsBusy這個欄位，在下面初始化Cell陣列中的用法一樣，就不多說了
            else if (cellsBusy == 0 && casCellsBusy()) {
                try {
                    //這裡就是新建一個數組是原來的兩倍，然後將原來陣列的元素複製到新的陣列，再改變原來的cells的引用指向新的陣列
                    if (cells == as) {      // Expand table unless stale
                        Cell[] rs = new Cell[n << 1];
                        for (int i = 0; i < n; ++i)
                            rs[i] = as[i];
                        cells = rs;
                    }
                } finally {
                    //使用完就重置為0
                    cellsBusy = 0;
                }
                collide = false;
                continue;                   // Retry with expanded table
            }
            //這裡的作用是當執行緒找了好久，發現所有Cell個數已經和CPU個數相同了，然後匹配到的Cell正在被其他執行緒使用
            //於是為了找到一個空閒的Cell，於是要重新計算hash值
            h = advanceProbe(h);
        }



        //初始化Cell陣列
        //記得上面好像說過cellsBusy這個欄位是能是0或者是1，當時0的時候，說明Cell陣列沒有初始化和擴容，也沒有正在建立Cell元素，
        //反之則為1，而casCellsBusy()方法就是用CAS將cellsBusy的值從0修改為1，表示當前執行緒正在初始化Cell陣列，其他執行緒就不能進行擴容操作了
        //如果一個執行緒在初始化這個Cell陣列，其他執行緒在擴容的時候，看上面擴容，也會執行casCellsBusy()方法進行CAS操作，會失敗，因為期望的值是1，而不是0
        else if (cellsBusy == 0 && cells == as && casCellsBusy()) {
            boolean init = false;
            try {                           // Initialize table
                if (cells == as) {
                    //這裡首先新建一個容量為2的陣列，然後用隨機數h&1，也就是隨機數對陣列的容量取餘的方式得到索引，然後初始化陣列中每個Cell元素
                    Cell[] rs = new Cell[2];
                    rs[h & 1] = new Cell(x);
                    cells = rs;
                    init = true;
                }
            } finally {
                //初始化完成之後要把這個欄位重置為0，表示此時其他執行緒就又可以對這個Cell進行擴容了
                cellsBusy = 0;
            }
            if (init)
                break;
        }
　　　　　//將base更新為base+x，表示base會逐漸累加Cell陣列中每一個Cell中的值
        else if (casBase(v = base, ((fn == null) ? v + x :
                                    fn.applyAsLong(v, x))))
            break;                          // Fall back on using base
    }
}

　　其實longAccumulate方法就是表示多執行緒的時候對Cell陣列的初始化，新增Cell元素還有擴容操作，還有就是當一個執行緒匹配到了Cell元素，發現其他執行緒正在使用就會重新計算隨機數，然後繼續匹配其他的Cell元素去了，沒什麼特別難的吧！別看這個方法很長，就是做這幾個操作

六.總結

　　這一篇核心就是CAS，我們簡單的說了一下原子操作類AtomicLong的自增，但是當執行緒很多的情況下，使用CAS有很大的缺點，就是同一時間是會有一個執行緒在執行，其他所有執行緒都在自旋，自旋會消耗效能，於是可以使用JDK提供的一個LongAdder類代替，這個類的作用就是將AtomicLong中的值優化為了一個base和一個Cell陣列，多執行緒去競爭的時候，假設執行緒個數個CPU個數相同，那麼此時每一個執行緒都有單獨的一個CPU去執行，然後單獨的匹配到Cell陣列中的某個元素，如果沒有匹配到那麼會對這個Cell陣列進行初始化操作；如果匹配到的Cell陣列中的元素正在使用，那麼久判斷是否可以新建一個Cell丟數組裡面去，如果陣列已經滿了，而且陣列數量小於CPU個數，那麼久進行擴容；擴容結束後，還是匹配到的Cell陣列中的位置正在使用，那麼就是衝突，就會重新計算，通過一個新的隨機數和陣列的取餘，得到一個新的索引，再去訪問該對應的Cell陣列的位置。。。。

　　仔細看看還是挺有意思的

JUC中的原子操作類及其原理

JUC中的原子操作類及其原理

Java併發程式設計（十一）Java中的原子操作類

多執行緒學習筆記十三——java中的原子操作類

併發：Java中的13個原子操作類。

24.Java中atomic包中的原子操作類總結

java高併發系列 - 第23天：JUC中原子類，一篇就夠了

PHP實現Collection數據集類及其原理

原子操作類（一）原子操作類詳細介紹

基於接口回調詳解JUC中Callable和FutureTask實現原理

JAVA 原子操作類

java併發之原子操作類(AtomicLong原始碼分析)和非阻塞演算法

java 原子操作的實現原理(1)

java 原子操作的實現原理(2)

原子操作的實現原理

基於介面回撥詳解JUC中Callable和FutureTask實現原理

Java併發程式設計的藝術——原子操作的實現原理

聊聊併發（五）原子操作的實現原理

GCC原子操作類模板

併發程式設計-concurrent指南-原子操作類-AtomicInteger

併發程式設計-concurrent指南-原子操作類-AtomicBoolean

JUC中的原子操作類及其原理

相關推薦