1. 程式人生 > >併發的HashMap為什麼會引起死迴圈?

併發的HashMap為什麼會引起死迴圈?

今天研讀Java併發容器和框架時,看到為什麼要使用ConcurrentHashMap時,其中有一個原因是:執行緒不安全的HashMap, HashMap在併發執行put操作時會引起死迴圈,是因為多執行緒會導致HashMap的Entry連結串列形成環形資料結構,查詢時會陷入死迴圈。糾起原因看了其他的部落格,都比較抽象,所以這裡以圖形的方式展示一下,希望支援!

(1)當往HashMap中新增元素時,會引起HashMap容器的擴容,原理不再解釋,直接附原始碼,如下:

/** 
    * 
    * 往表中新增元素,如果插入元素之後,表長度不夠,便會呼叫resize方法擴容 
    */  
   void addEntry(int hash, K key, V value, int bucketIndex) {  
Entry<K,V> e = table[bucketIndex];  
       table[bucketIndex] = new Entry<K,V>(hash, key, value, e);  
       if (size++ >= threshold)  
           resize(2 * table.length);  
   }  
  
   /** 
    * resize()方法如下,重要的是transfer方法,把舊錶中的元素新增到新表中
    */  
   void resize(int newCapacity) {  
       Entry[] oldTable = table;  
       int oldCapacity = oldTable.length;  
       if (oldCapacity == MAXIMUM_CAPACITY) {  
           threshold = Integer.MAX_VALUE;  
           return;  
       }  
  
       Entry[] newTable = new Entry[newCapacity];  
       transfer(newTable);  
       table = newTable;  
       threshold = (int)(newCapacity * loadFactor);  
   }  
(2)參考上面的程式碼,便引入到了transfer方法,(引入重點)這就是HashMap併發時,會引起死迴圈的根本原因所在,下面結合transfer的原始碼,說明一下產生死迴圈的原理,先列transfer程式碼(這是裡JDK7的源偌),如下:
/**
     * Transfers all entries from current table to newTable.
     */
    void transfer(Entry[] newTable, boolean rehash) {
        int newCapacity = newTable.length;
        for (Entry<K,V> e : table) {

            while(null != e) {
                Entry<K,V> next = e.next;            ---------------------(1)
                if (rehash) {
                    e.hash = null == e.key ? 0 : hash(e.key);
                }
                int i = indexFor(e.hash, newCapacity); 
                e.next = newTable[i];
                newTable[i] = e;
                e = next;
            } // while

        }
    }

(3)假設:

Map<Integer> map = new HashMap<Integer>(2);  // 只能放置兩個元素,其中的threshold為1(表中只填充一個元素時),即插入元素為1時就擴容(由addEntry方法中得知)
//放置2個元素 3 和 7,若要再放置元素8(經hash對映後不等於1)時,會引起擴容

假設放置結果圖如下:

     

 現在有兩個執行緒A和B,都要執行put操作,即向表中新增元素,即執行緒A和執行緒B都會看到上面圖的狀態快照

執行順序如下:

               執行一:  執行緒A執行到transfer函式中(1)處掛起(transfer函式程式碼中有標註)。此時線上程A的棧中

e = 3
next = 7

              執行二:執行緒B執行 transfer函式中的while迴圈,即會把原來的table變成新一table(執行緒B自己的棧中),再寫入到記憶體中。如下圖(假設兩個元素在新的hash函式下也會對映到同一個位置)


             執行三: 執行緒A解掛,接著執行(看到的仍是舊錶),即從transfer程式碼(1)處接著執行,當前的 e = 3, next = 7, 上面已經描述。

                             1. 處理元素 3 , 將 3 放入 執行緒A自己棧的新table中(新table是處於執行緒A自己棧中,是執行緒私有的,不肥執行緒2的影響),處理3後的圖如下:

                                2.  執行緒A再複製元素 7 ,當前 e = 7 ,而next值由於執行緒 B 修改了它的引用,所以next 為 3 ,處理後的新表如下圖



                           3. 由於上面取到的next = 3, 接著while迴圈,即當前處理的結點為3, next就為null ,退出while迴圈,執行完while迴圈後,新表中的內容如下圖:

 

                              4. 當操作完成,執行查詢時,會陷入死迴圈!

歡迎大家指正!