ConcurrentHashMap的size方法是執行緒安全的嗎？

阿新 • • 發佈：2020-09-07

## 前言之前在面試的過程中有被問到，ConcurrentHashMap的size方法是執行緒安全的嗎？這個問題，確實沒有答好。這次來根據原始碼來了解一下，具體是怎麼一個實現過程。 ### ConcurrentHashMap的原理與結構我們都知道Hash表的結構是陣列加連結串列，就是一個數組中，每一個元素都是一個連結串列，有時候也把會形象的把陣列中的每個元素稱為一個“**桶**”。在插入元素的時候，首先通過對傳入的鍵（key），進行一個雜湊函式的處理，來確定元素應該存放於陣列中哪個一個元素的連結串列中。這種資料結構在很多計算機語言中都能找到其身影，在Java中如HashMap，ConcurrentHashMap等都是這種資料結構。但是這中資料結構在實現HashMap的時候並不是執行緒安全的，因為在HashMap擴容的時候，是會將原先的連結串列遷移至新的連結串列陣列中，在遷移過程中多執行緒情況下會有造成連結串列的死迴圈情況（JDK1.7之前的頭插法）；還有就是在多執行緒插入的時候也會造成連結串列中資料的覆蓋導致資料丟失。所以就出現了執行緒安全的HashMap類似的hash表集合，典型的就是HashTable和ConcurrentHashMap。 Hashtable實現執行緒安全的代價比較大，那就是在所有可能產生競爭方法裡都加上了synchronized，這樣就會導致，當出現競爭的時候只有一個執行緒能對整個Hashtable進行操作，其他所有執行緒都需要阻塞等待當前獲取到鎖的執行緒執行完成。這樣效率是非常低的。而ConcurrentHashMap解決執行緒安全的方式就不一樣了，它避免了對整個Map進行加鎖，從而提高了併發的效率。下面將具體介紹一下JDK1.7和1.8的實現。 #### JDK1.7中的ConcurrentHashMap JDK1.7中的ConcurrentHashMap採用了分段鎖的形式，每一段為一個Segment類，它內部類似HashMap的結構，內部有一個Entry陣列，陣列的每個元素是一個連結串列。同時Segment類繼承自`ReentrantLock`。結構如下： ![在這裡插入圖片描述](https://img-blog.csdnimg.cn/20200906165256570.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_SmlNb2Vy,size_60,color_c8cae6,t_70#pic_center) 在HashEntry中採用了volatile來修飾了HashEntry的當前值和next元素的值。所以get方法在獲取資料的時候是不需要加鎖的，這樣就大大的提供了執行效率。 **在執行`put()`方法的時候會先嚐試獲取鎖（`tryLock()`），如果獲取鎖失敗，說明存在競爭，那麼將通過`scanAndLockForPut()`方法執行自旋，當自旋次數達到`MAX_SCAN_RETRIES`時會執行阻塞鎖，直到獲取鎖成功。** 原始碼如下： ```java static final int MAX_SCAN_RETRIES = Runtime.getRuntime().availableProcessors() > 1 ? 64 : 1; ``` ```java final V put(K key, int hash, V value, boolean onlyIfAbsent) { // 首先嚐試獲取鎖，獲取失敗則執行自旋，自旋次數超過最大長度，後改為阻塞鎖，直到獲取鎖成功。 HashEntry node = tryLock() ? null : scanAndLockForPut(key, hash, value); V oldValue; try { HashEntry[] tab = table; int index = (tab.length - 1) & hash; HashEntry first = entryAt(tab, index); for (HashEntry e = first;;) { if (e != null) { K k; if ((k = e.key) == key || (e.hash == hash && key.equals(k))) { oldValue = e.value; if (!onlyIfAbsent) { e.value = value; ++modCount; } break; } e = e.next; } else { if (node != null) node.setNext(first); else node = new HashEntry(hash, key, value, first); int c = count + 1; if (c > threshold && tab.length < MAXIMUM_CAPACITY) rehash(node); else setEntryAt(tab, index, node); ++modCount; count = c; oldValue = null; break; } } } finally { unlock(); } return oldValue; } ``` #### JDK1.8後的ConcurrentHashMap 在JDK1.8中，放棄了Segment這種分段鎖的形式，而是採用了`CAS+Synchronized`的方式來保證併發操作的，採用了和HashMap一樣的結構，直接用陣列加連結串列，在連結串列長度大於8的時候為了提高查詢效率會將連結串列轉為紅黑樹（連結串列定位資料的時間複雜度為O(N)，紅黑樹定位資料的時間複雜度為O(logN)）。 **在程式碼上也和JDK1.8的HashMap很像，也是將原先的HashEntry改為了Node類，但還是使用了volatile修飾了當前值和next的值。從而保證了在獲取資料時候的高效。** JDK1.8中的ConcurrentHashMap在執行`put()`方法的時候還是有些複雜的，主要是為了保證執行緒安全才做了一系列的措施。原始碼如下： ![在這裡插入圖片描述](https://img-blog.csdnimg.cn/20200906210624764.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_SmlNb2Vy,size_60,color_c8cae6,t_70#pic_center) - ==第一步通過key進行hash。== - ==第二步判斷是否需要初始化資料結構。== - ==第三步根據key定位到當前`Node`，如果當前位置為空，則可以寫入資料，利用`CAS`機制嘗試寫入資料，如果寫入失敗，說明存在競爭，將會通過自旋來保證成功。== - ==第四步如果當前的`hashcode`值等於`MOVED`則需要進行擴容（擴容時也使用了`CAS`來保證了執行緒安全）。== - ==第五步如果上面四步都不滿足，那麼則通過`synchronized`阻塞鎖將資料寫入。== - ==第六步如果資料量大於`TREEIFY_THRESHOLD`時需要轉換成紅黑樹（預設為8）。== JDK1.8的ConcurrentHashMap的`get()`方法就還是比較簡單： - 根據`key`的`hashcode`定址到具體的桶上。 - 如果是紅黑樹則按照紅黑樹的方式去查詢資料。 - 如果是連結串列就按照遍歷連結串列的方式去查詢資料。 ```java public V get(Object key) { Node[] tab; Node e, p; int n, eh; K ek; int h = spread(key.hashCode()); if ((tab = table) != null && (n = tab.length) > 0 && (e = tabAt(tab, (n - 1) & h)) != null) { if ((eh = e.hash) == h) { if ((ek = e.key) == key || (ek != null && key.equals(ek))) return e.val; } else if (eh < 0) return (p = e.find(h, key)) != null ? p.val : null; while ((e = e.next) != null) { if (e.hash == h && ((ek = e.key) == key || (ek != null && key.equals(ek)))) return e.val; } } return null; } ``` #### ConcurrentHashMap的size方法 JDK1.7中的ConcurrentHashMap的size方法，計算size的時候會先不加鎖獲取一次資料長度，然後再獲取一次，最多三次。比較前後兩次的值，如果相同的話說明不存在競爭的編輯操作，就直接把值返回就可以了。但是如果前後獲取的值不一樣，那麼會將每個Segment都加上鎖，然後計算ConcurrentHashMap的size值。 ![在這裡插入圖片描述](https://img-blog.csdnimg.cn/20200906230329886.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_SmlNb2Vy,size_30,color_FFFFFF,t_70#pic_center) JDK1.8中的ConcurrentHashMap的`size()`方法的原始碼如下： ```java /** * {@inheritDoc} */ public int size() { long n = sumCount(); return ((n < 0L) ? 0 : (n > (long)Integer.MAX_VALUE) ? Integer.MAX_VALUE : (int)n); } ``` 這個方法最大會返回int的最大值，但是ConcurrentHashMap的長度有可能超過int的最大值。在JDK1.8中增加了`mappingCount()`方法，這個方法的返回值是long型別的，所以JDK1.8以後更推薦用這個方法獲取Map中資料的數量。 ```java /** * @return the number of mappings * @since 1.8 */ public long mappingCount() { long n = sumCount(); return (n < 0L) ? 0L : n; // ignore transient negative values } ``` 無論是`size()`方法還是`mappingCount()`方法，核心方法都是`sumCount()`方法。原始碼如下： ```java final long sumCount() { CounterCell[] as = counterCells; CounterCell a; long sum = baseCount; if (as != null) { for (int i = 0; i < as.length; ++i) { if ((a = as[i]) != null) sum += a.value; } } return sum; } ``` 在上面sumCount()方法中我們看到，當`counterCells`為空時直接返回`baseCount`，當`counterCells`不為空時遍歷它並壘加到`baseCount`中。先看`baseCount` ```java /** * Base counter value, used mainly when there is no contention, * but also as a fallback during table initialization * races. Updated via CAS. */ private transient volatile long baseCount; ``` `baseCount`是一個`volatile`變數，那麼我們來看在`put()`方法執行時是如何使用baseCount的，在put方法的最後一段程式碼中會呼叫`addCount()`方法，而`addCount()`方法的原始碼如下： ![在這裡插入圖片描述](https://img-blog.csdnimg.cn/2020090623282077.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_SmlNb2Vy,size_36,color_FFFFFF,t_70#pic_center) 首先對baseCount做CAS自增操作。如果併發導致了baseCount的CAS失敗了，則使用counterCells進行CAS。如果counterCells的CAS也失敗了，那麼則進入`fullAddCount()`方法，`fullAddCount()`方法中會進入死迴圈，直到成功為止。 ![在這裡插入圖片描述](https://img-blog.csdnimg.cn/20200906233503591.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_SmlNb2Vy,size_36,color_FFFFFF,t_70#pic_center) 那麼CountCell到底是個什麼呢？原始碼如下： ```java /** * A padded cell for distributing counts. Adapted from LongAdder * and Striped64. See their internal docs for explanation. */ @sun.misc.Contended static final class CounterCell { volatile long value; CounterCell(long x) { value = x; } } ``` 一個使用了 `@sun.misc.Contended` 標記的類，內部一個 `volatile` 變數。 `@sun.misc.Contended` 這個註解是為了防止“偽共享”。那麼什麼是偽共享呢？ >

快取系統中是以快取行（cache line）為單位儲存的。快取行是2的整數冪個連續位元組，一般為32-256個位元組。最常見的快取行大小是64個位元組。當多執行緒修改互相獨立的變數時，如果這些變數共享同一個快取行，就會無意中影響彼此的效能，這就是偽共享。所以偽共享對效能危害極大。 JDK 8 版本之前沒有這個註解，JDK1.8之後使用拼接來解決這個問題，把快取行加滿，讓快取之間的修改互不影響。 ### 總結 **無論是JDK1.7還是JDK1.8中，ConcurrentHashMap的`size()`方法都是執行緒安全的，都是準確的計算出實際的數量，但是這個資料在併發場景下是隨時都在變

對java中File.mkdirs方法執行緒安全問題的一點探討

mkdirs是java中用來一次建立多級目錄的方法，在java.io.File類中。我在程式設計中遇到這樣一段程式碼： if (!dest.exists()) { dest.mkdirs(); } if (!dest.isDirectory

區域性變數一定執行緒安全嗎

區域性變數, 如果是基本型別或是包裝型別, 依然不能通過多執行緒改變其值, 如果是物件, 則其屬性值是執行緒不安全的 demo1: public void compute(LocalDate date){ //在切換租戶時,只有當前執行緒的第一個租戶id

面試題，Servlet 執行緒安全嗎？

Servlet的工作原理：首先客戶傳送一個請求，Servlet是呼叫service()方法對請求進行響應的，通過原始碼可見，service()方法中對請求的方式進行了匹配，選擇呼叫doGet,doPost等這些方法，然後再進入對應的方法中呼叫邏輯層的方法，實現對客戶的響應。在

Vector 真的執行緒安全嗎？

Vector裡一些寫刪操作的方法都是用synchronized實現同步，這樣vecotor在使用時真的不需要考慮執行緒安全問題嗎？答案是否！下面看一個例子： Vector vector = new Vector(); public void put(String e

ConcurrentHashMap執行緒安全嗎?

# 前言沒啥深入實踐的理論系同學，在使用併發工具時，總是認為把`HashMap`改為`ConcurrentHashMap`，就完美解決併發了呀。或者使用寫時複製的`CopyOnWriteArrayList`，效能更佳呀！技術言論雖然自由，但面對魔鬼面試官時，我們更在乎的是這些真的正確嗎？[整理了100+個J

ConcurrentHashMap的size方法是執行緒安全的嗎？

## 前言之前在面試的過程中有被問到，ConcurrentHashMap的size方法是執行緒安全的嗎？這個問題，確實沒有答好。這次來根據原始碼來了解一下，具體是怎麼一個實現過程。 ### ConcurrentHashMap的原理與結構我們都知道Hash表的結構是陣列加連結串列，就是一個數組中，每一個元

JVM——執行緒安全的實現方法

一互斥同步（悲觀的併發策略）同步是指在多個執行緒併發訪問共享資料時，保證共享資料在同一時刻只被一個執行緒使用。互斥是實現同步的一種手段，下面介紹兩種互斥同步的手段：synchronized關鍵字和concurrent包中的重入鎖ReentrantLock synchronized關鍵字：

呼叫Spring所管理的bean的方法時候，為何不會出現執行緒安全問題？

首先jvm會在記憶體中開闢一塊儲存空間做為執行緒棧空間，每個執行緒都有自己的棧(後進先出)。呼叫方法時，會在棧中壓入一個棧幀，用來儲存這個方法的引數和區域性變數；方法返回時，棧幀就會彈出，方法的引數和區域性變數就會清除；方法呼叫時，呼叫棧不斷處於漲落之中，如果呼叫的層級過深，

Java面試題：Servlet是執行緒安全的嗎？

轉自： http://www.cnblogs.com/chanshuyi/p/5052426.html Servlet不是執行緒安全的。要解釋為什麼Servlet為什麼不是執行緒安全的，需要了解Servlet容器（即Tomcat）使如何響應HTTP請求的。

2017.10.20 C#跨執行緒操作控制元件的執行緒安全方法

C#跨執行緒操作控制元件的執行緒安全方法在C#中，經常用到這樣一個場景，Windows Form程式啟動一個工作者執行緒執行一部分工作，這樣做是為了避免速度慢的工作如果直接呼叫會使得主Form停止響應一段時間。既然啟動了執行緒，就避免不了執行緒之間資料傳遞的事情，相信你有很多種辦法

Hibernate中SessionFactory是執行緒安全的嗎？Session是執行緒安全的嗎（兩個執行緒能夠共享同一個Session嗎）？

Hibernate中SessionFactory是執行緒安全的嗎？Session是執行緒安全的嗎（兩個執行緒能夠共享同一個Session嗎）？ SessionFactory對應Hibernate的一個數據儲存的概念，它是執行緒安全的，可以被多個執行緒併發訪問。 Sessio

Python中的多執行緒程式設計，執行緒安全與鎖(一) 聊聊Python中的GIL 聊聊Python中的GIL python基礎之多執行緒鎖機制 python--threading多執行緒總結 Python3入門之執行緒threading常用方法

1. 多執行緒程式設計與執行緒安全相關重要概念在我的上篇博文聊聊Python中的GIL 中，我們熟悉了幾個特別重要的概念：GIL，執行緒，程序，執行緒安全，原子操作。以下是簡單回顧，詳細介紹請直接看聊聊Python中的GIL GIL:&n

ConcurrentHashMap的size方法是執行緒安全的嗎？

對java中File.mkdirs方法執行緒安全問題的一點探討

區域性變數一定執行緒安全嗎

面試題，Servlet 執行緒安全嗎？

Vector 真的執行緒安全嗎？

ConcurrentHashMap執行緒安全嗎?

ConcurrentHashMap的size方法是執行緒安全的嗎？

JVM——執行緒安全的實現方法

呼叫Spring所管理的bean的方法時候，為何不會出現執行緒安全問題？

Java面試題：Servlet是執行緒安全的嗎？

2017.10.20 C#跨執行緒操作控制元件的執行緒安全方法

Hibernate中SessionFactory是執行緒安全的嗎？Session是執行緒安全的嗎（兩個執行緒能夠共享同一個Session嗎）？

Python中的多執行緒程式設計，執行緒安全與鎖(一) 聊聊Python中的GIL 聊聊Python中的GIL python基礎之多執行緒鎖機制 python--threading多執行緒總結 Python3入門之執行緒threading常用方法

JAVA 同步之 synchronized 修飾方法被多物件訪問是否執行緒安全？

C# 多執行緒呼叫靜態方法或者靜態例項中的同一個方法-方法內部的變數是執行緒安全的

你的單例模式真的是執行緒安全的嗎?

執行緒安全-鎖機制 synchronized用法同步方法

javaSE (三十五）多執行緒（多執行緒實現方法和區別、同步程式碼塊和方法（執行緒安全））

Java建立執行緒安全的方法

Java——單例模式的static方法和非static方法是否是執行緒安全的？

多執行緒中的方法、兩種實現方式、匿名內部類建立多執行緒，執行緒安全問題的解決、

ConcurrentHashMap的size方法是執行緒安全的嗎？

相關推薦