ConcurrentHashMap原始碼刨析（基於jdk1.7）

阿新 • • 發佈：2019-06-07

看原始碼前我們必須先知道一下ConcurrentHashMap的基本結構。ConcurrentHashMap是採用分段鎖來進行併發控制的。

其中有一個內部類為Segment類用來表示鎖。而Segment類裡又有一個HashEntry<K,V>[]陣列，這個陣列才是真正用

來存放我們的key-value的。

大概為如下圖結構。一個Segment陣列，而Segment陣列每個元素為一個HashEntry陣列

看原始碼前我們還必須瞭解的幾個預設的常量值：

DEFAULT_INITIAL_CAPACITY = 16   容器預設容量為16

DEFAULT_LOAD_FACTOR = 0.75f     預設擴容因子是0.75

DEFAULT_CONCURRENCY_LEVEL = 16  預設併發度是16

MAXIMUM_CAPACITY = 1 << 30      容器最大容量為1073741824

MIN_SEGMENT_TABLE_CAPACITY = 2  段的最小大小

MAX_SEGMENTS = 1 << 16          段的最大大小

RETRIES_BEFORE_LOCK = 2         通過不獲取鎖的方式嘗試獲取size的次數

以上以及預設值是ConcurrentHashMap中定義好的，下面我們很多地方會用到他們。

先從初始化開始說起

通過我們使用ConcurrentHashMap都是通過 ConcurrentHashMap<String,String> map = new ConcurrentHashMap<>();的方式

我們點進去跟蹤下原始碼

/**
     * Creates a new, empty map with a default initial capacity (16),
     * load factor (0.75) and concurrencyLevel (16).
     */
    public ConcurrentHashMap() {
        this(DEFAULT_INITIAL_CAPACITY, DEFAULT_LOAD_FACTOR, DEFAULT_CONCURRENCY_LEVEL);
    }

可以看到，預設無參建構函式內呼叫了另一個帶參建構函式，而這個建構函式也就是不管你初始化時傳進來什麼引數，最終都會跳到那個帶參建構函式。

點進去看看這個帶參建構函式實現了什麼功能

public ConcurrentHashMap(int initialCapacity,
                             float loadFactor, int concurrencyLevel) {
        if (!(loadFactor > 0) || initialCapacity < 0 || concurrencyLevel <= 0)
            throw new IllegalArgumentException();
        if (concurrencyLevel > MAX_SEGMENTS)
            concurrencyLevel = MAX_SEGMENTS;
        // Find power-of-two sizes best matching arguments
        int sshift = 0;
        int ssize = 1;
        while (ssize < concurrencyLevel) {
            ++sshift;
            ssize <<= 1;
        }
        this.segmentShift = 32 - sshift;
        this.segmentMask = ssize - 1;
        if (initialCapacity > MAXIMUM_CAPACITY)
            initialCapacity = MAXIMUM_CAPACITY;
        int c = initialCapacity / ssize;
        if (c * ssize < initialCapacity)
            ++c;
        int cap = MIN_SEGMENT_TABLE_CAPACITY;
        while (cap < c)
            cap <<= 1;
        // create segments and segments[0]
        Segment<K,V> s0 =
            new Segment<K,V>(loadFactor, (int)(cap * loadFactor),
                             (HashEntry<K,V>[])new HashEntry[cap]);
        Segment<K,V>[] ss = (Segment<K,V>[])new Segment[ssize];
        UNSAFE.putOrderedObject(ss, SBASE, s0); // ordered write of segments[0]
        this.segments = ss;
    }

我們看到該建構函式一共有三個引數，分別是容器的初始化大小、負載因子、併發度，這三個引數如果我們new 一個ConcurrentHashMap時沒有指定，

那麼將會採用預設的引數，也就是我們本文開始說的那幾個常量值。

在這裡我對這三個引數做下解釋。容器初始化大小是整個map的容量。負載因子是用來計算每個segment裡的HashEntry陣列擴容時的閾值的。併發度是

用來設定segment陣列的長度的。

開頭這兩個if沒什麼好說的。就是用來判斷我們傳進來的引數的正確性。當負載因子，初始容量和併發度不按照規範來時會丟擲算術異常。第二個if時當傳進來的

併發度大於最大段大小的時候，就將其設定為最大段大小。

這段就比較有意思了。由於segment陣列要求長度必須為2的n次方，當我們傳進來的併發度不是2的n次方時會計算出一個最接近它的2的n次方值

比如如何我們傳進來的併發度為14 15那麼通過計算segment陣列長度就是16。在上圖中我們可以看到兩個區域性變數ssize和sshift，在迴圈中如果ssize小於

併發度就將其二進位制左移一位，即乘2。因此ssize就是用來儲存我們計算出來的最接近併發度的2的n次方值。而ssfhit是用來計算偏移量的。在這裡我們又

要說兩個很重要的全域性常量。segmentMask和segmentShift。其中segmentMask為ssize - 1，由於ssize為2的倍數。那麼segmentMask就是奇數。化為

二進位制就是全1，而segmentShift為32 - sshift大小。32是key值經過再hash求出來的值的二進位制位。segmentMask和segmentShift是用來定位當前元素

在segment陣列那個位置，和在HashEntry陣列的哪個位置，後面我們會詳細說說怎麼算的。

這一段程式碼就是用來確定每個segment裡面的hashentry的一些引數和初始化segment陣列了。第一個if是防止我們設定的初始化

容量大於最大容量。而c是用來計算每個hashentry陣列的容量。由於每個hashentry陣列容量也需要為2的n次方，因此這裡也需要

一個cap和迴圈來計算一個2的n次方值，方法和上面一樣。這裡計算出來的cap值就是最終hashentry陣列實際的大小了。

初始化就做了這些工作了。

那麼我們在說說最簡單的get方法。

get方法就需要用到定位我們的元素了。而定位元素就需要我們上面初始化時設定好的兩個值：segmentMask和segmentShift

上面說了，併發度預設值為16，那麼ssize也為16，因此segmentMask為15.由於ssize二進位制往左移了4位，那麼sshift就是4，

segmentShift就是32-4=28.下面我們就用segmentMask=15，segmentShift為28來說說怎麼確定元素位置的。

在這裡我們要說下hash值，這裡的hash值不是key的hashcode值，而是經過再hash確定下來的一個hash值，目的是為了減少hash衝突。

hash值二進位制為32位。

上圖兩個紅框就是分別確定segment陣列中的位置和hashentry陣列中的位置。

我們可以看到確定segment陣列是採用 (h >>> segmentShift) & segmentMask，其中h為再hash過的hash值。將32為的hash值往右移segmentShift位。這裡我們假設移了28位。

而segmentMask為15，就是4位都為一的二進位制。將高4位與segmentMask相與會等到一個小於16的值，就是當前元素再的segment位置。

確定了所屬的segment後。就要確認在的hashentry位置了。通過第二個紅框處，我們可以看到確定hashentry的位置沒有使用上面兩個值了。而是直接使用當前hashentry陣列的長度減一

和hash值想與。通過兩種不同的演算法分別定位segment和hashenrty可以保證元素在segment陣列和hashentry數組裡面都雜湊開了。

Put方法

public V put(K key, V value) {
        Segment<K,V> s;
        if (value == null)
            throw new NullPointerException();
        int hash = hash(key);
        int j = (hash >>> segmentShift) & segmentMask;
        if ((s = (Segment<K,V>)UNSAFE.getObject          // nonvolatile; recheck
             (segments, (j << SSHIFT) + SBASE)) == null) //  in ensureSegment
            s = ensureSegment(j);
        return s.put(key, hash, value, false);
    }

final V put(K key, int hash, V value, boolean onlyIfAbsent) {
            HashEntry<K,V> node = tryLock() ? null :
                scanAndLockForPut(key, hash, value);
            V oldValue;
            try {
                HashEntry<K,V>[] tab = table;
                int index = (tab.length - 1) & hash;
                HashEntry<K,V> first = entryAt(tab, index);
                for (HashEntry<K,V> e = first;;) {
                    if (e != null) {
                        K k;
                        if ((k = e.key) == key ||
                            (e.hash == hash && key.equals(k))) {
                            oldValue = e.value;
                            if (!onlyIfAbsent) {
                                e.value = value;
                                ++modCount;
                            }
                            break;
                        }
                        e = e.next;
                    }
                    else {
                        if (node != null)
                            node.setNext(first);
                        else
                            node = new HashEntry<K,V>(hash, key, value, first);
                        int c = count + 1;
                        if (c > threshold && tab.length < MAXIMUM_CAPACITY)
                            rehash(node);
                        else
                            setEntryAt(tab, index, node);
                        ++modCount;
                        count = c;
                        oldValue = null;
                        break;
                    }
                }
            } finally {
                unlock();
            }
            return oldValue;
        }

上面兩片程式碼就是put一個元素的過程。由於Put方法裡需要對共享變數進行寫入操作，因此為了安全，需要在操作共享變數時加鎖。put時先定位到segment，然後在segment裡及逆行擦汗如操作。

插入有兩個步驟，第一步判斷是否需要對segment裡的hashenrty陣列進行擴容。第二步是定位新增元素的位置，然後將其放在hashenrty數組裡。

我們先說說擴容。

在插入元素的時候會先判斷segment裡面的hashenrty陣列是否超過容量threshold。這個容量是我們剛開始初始化hashenrty陣列時採用容量大小和負載因子計算出來的。

如果超過這個閾值（threshold）那麼就會進行擴容。擴容括的時當前hashenrty而不是整個map。

如何擴容

擴容的時候會先建立一個容量是原來兩個容量大小的陣列，然後將原數組裡的元素進行再雜湊後插入到新的數組裡。

Size方法

由於map裡的元素是遍佈所有hashenrty的。因此統計size的時候需要統計每個hashenrty的大小。由於是併發環境下，可能出現有執行緒在插入或者刪除的情況。因此會出現

錯誤。我們能想到的就是使用size方法時把所有的segment的put，remove和clean方法都鎖起來。但是這種方法時很低效的。因此concurrenthashmap採用了以下辦法：

先嚐試2次通過不加鎖的方式來統計各個segment大小，如果統計的過程中，容器的count發生了變化，再採用加鎖的方式來統計所有segment的大小。

concurrenthashmap時使用modcount變數來判斷再統計的時候容器是否放生了變化。在put、remove、clean方法裡操作資料前都會將辯能力modCount進行加一，那麼在統計

size千後比較modCount是否發生變化，就可以知道容器大小是否發生變化

ConcurrentHashMap原始碼刨析（基於jdk1.7）

看原始碼前我們必須先知道一下ConcurrentHashMap的基本結構。ConcurrentHashMap是採用分段鎖來進行併發控制的。其中有一個內部類為Segment類用來表示鎖。而Segment類裡又有一個HashEntry<K,V>[]陣列，這個陣列才是真正用來存放我們的key-v

LinkedHashMap及其原始碼分析（基於JDK1.7）

LinkedHashMap及其原始碼分析閱讀目錄什麼是LinkedHashMap LinkedHashMap補充說明 LinkedHashMap的陣列結構 LinkedHashMap繼承的類與實現的介面 LinkedHashMap原始碼中雙向連結串列的

HashMap原始碼解析（基於JDK1.7）

一、HashMap簡介雜湊表（hash table）也叫散列表，是一種非常重要的資料結構，應用場景及其豐富，許多快取技術（比如memcached）的核心其實就是在記憶體中維護一張大的雜湊表，而HashMap的實現原理就是基於此。那麼什麼是雜湊表呢？在討論

maven 對spark 原始碼進行編譯（基於Centos 7 ）

maven 對spark 原始碼進行編譯（基於Centos 7 ） 1 、寫在前面的話有些小夥伴可能會問：Spark官網不是已經提供了Spark針對不同版本的

java基礎系列之ConcurrentHashMap源碼分析（基於jdk1.8）

threshold 主存類比 tile num method 過程參數 nsf 1、前提　　在閱讀這篇博客之前，希望你對HashMap已經是有所理解的；另外你對java的cas操作也是有一定了解的，因為在這個類中大量使用到了cas相關的操作來保證線程安全的。　　

Java原始碼閱讀-Integer（基於jdk1.8）

public final class Integer extends Number implements Comparable<Integer> 　　Integer 由final修飾了，所以該類不能夠被繼承，同時 Integer 繼承了Number類，因此可以將Integer轉換成 int

java集合之----HashMap原始碼分析（基於JDK1.7與1.8）

一、什麼是HashMap 百度百科這樣解釋：簡而言之，HashMap儲存的是鍵值對（key和value），通過key對映到value，具有很快的訪問速度。HashMap是非執行緒安全的，也就是說在多執行緒併發環境下會出現問題（死迴圈）二、內部實現（1）結構 HashM

ConcurrentHashMap & HashMap最清晰的底層原理分析（基於JDK1.7跟1.8比較）

前言 Map 這樣的 Key Value 在軟體開發中是非常經典的結構，常用於在記憶體中存放資料。本篇主要想討論 ConcurrentHashMap 這樣一個併發容器，在正式開始之前我覺得有必要談談 HashMap，沒有它就不會有後面的 ConcurrentHashM

1.走進java（本次閱讀基於jdk1.7）

jvm 深入理解java虛擬機本次閱讀基於jdk1.71.1.java虛擬機類別和發展史：Sun Classic / Exact VM:世界上第一款商用Java虛擬機,Sun公司發布JDK 1.0，Java語言首次擁有了商用的正式運行環境，這個JDK中所帶的虛擬機就是Classic VMSun Ho

java集合之----ArrayList原始碼分析（基於jdk1.8）

一、ArrayList 1、ArrayList是什麼： ArrayList就是動態陣列，用MSDN中的說法，就是Array的複雜版本，它提供了動態的增加和減少元素，實現了ICollection和IList介面，靈活的設定陣列的大小等好處，實現了Randomaccess介面，支援快速隨

WeakHashMap原始碼探討（基於JDK1.8）

WeakHashMap簡介 WeakHashMap跟普通的HashMap不同，WeakHashMap的行為一定程度上基於垃圾收集器的行為，因此一些Map資料結構對應的常識在WeakHashMap上會失效——size()方法的返回值會隨著程式的執行變小，isE

HashSet原始碼探討（基於JDK1.8）

HashSet 簡介如果對HashMap沒有了解，應該先學習HashMap再學習HashSet 。 HashSet結構 publicclassHashSet<E>extendsA

JAVA集合原始碼解析 Hashtable探索（基於JDK1.8）

JDK1.8Hashtable探索本文的討論分析是基於JDK1.8進行的依舊是採用前幾篇文章的大綱來進行介紹 1.簡介 Hashtable 採用陣列+單鏈表來實現的，Hashtable 實現了一個雜湊表，它將鍵對映到值。任何非 nu

HashMap原始碼解析（基於JDK1.8）

雜湊是一種用於以常數平均時間執行插入、刪除和查詢的技術。HashMap是基於雜湊表的Map介面實現，該實現提供了所有可選的對映操作，並允許使用空值和空鍵。（HashMap 類大致等同於Hashtable，除了它是不同步的並且允許為空值。）這個類不能保證M

Java記憶體區域劃分、記憶體分配原理（基於jdk1.7 源自《深入理解java虛擬機器》）

執行時資料區域 Java虛擬機器在執行Java的過程中會把管理的記憶體劃分為若干個不同的資料區域。這些區域有各自的用途，以及建立和銷燬的時間，有的區域隨著虛擬機器程序的啟動而存在，而有的區域則依賴執行緒的啟動和結束而建立和銷燬。 Java虛擬機

刨死你係列——LinkedHashMap剖析（基於jdk1.8）

一、概述　　1.8版本的LinkedHashMap 繼承自 HashMap，在 HashMap（陣列連結串列+紅黑樹）基礎上，通過維護一條雙向連結串列，解決了 HashMap 不能隨時保持遍歷順序和插入順序一致的問題。除此之外，LinkedHashMap 對訪問順序也提供了相關支援。在一些場景下，該特性很

ArrayList的實現細節（基於JDK1.8）

cati port 內存 ont cit blank pla 失敗關於 ArrayList是我們經常用到的一個類，下面總結一下它內部的實現細節和使用時要註意的地方。基本概念 ArrayList在數據結構的層面上講，是一個用數組實現的list，從應用層面上講，就是一個容量

java集合總結（基於jdk1.6）

Map Hashmap 底層由陣列和單向連結串列實現，put的時候計算key的hashcode，找到陣列的對應位置，然後通過單向連結串列entry來維護。內部類entry中通過next維護單向連結串列。 tip1：初始化hashmap的時候，根據需求初始化陣列大小initialC

淺談java執行緒池（基於jdk1.8）

多執行緒讓程式世界豐富多彩，也讓其錯綜複雜。對於執行緒的建立和銷燬成了一筆不小的開銷，為了減少這些開銷，出現了執行緒池。執行緒池對執行緒進行管理，對於需要使用多執行緒的你來說，只需要把你的任務丟給執行緒池就可以了。當你把任務丟給執行緒池的時候，它是如何處理的呢？

搭建 Git 伺服器（基於 CentOS 7）

對於規模比較小的團隊，可以直接搭建 Git 伺服器，逐個收集研發同學的證書配置進來即可。如果團隊規模比較大，可以直接採用 GitLab、Drone 等現成的帶有許可權管理的 Git 服務。伺服器端操作安裝 Git 對於 CentOS，可以直

ConcurrentHashMap原始碼刨析（基於jdk1.7）

先從初始化開始說起

那麼我們在說說最簡單的get方法。

Put方法

Size方法

相關推薦