老生常談，HashMap的死迴圈

阿新 • • 發佈：2019-04-22

問題

最近的幾次面試中，我都問了是否瞭解HashMap在併發使用時可能發生死迴圈，導致cpu100%，結果讓我很意外，都表示不知道有這樣的問題，讓我意外的是面試者的工作年限都不短。

由於HashMap並非是執行緒安全的，所以在高併發的情況下必然會出現問題，這是一個普遍的問題，雖然網上分析的文章很多，還是覺得有必須寫一篇文章，讓關注我公眾號的同學能夠意識到這個問題，並瞭解這個死迴圈是如何產生的。

如果是在單執行緒下使用HashMap，自然是沒有問題的，如果後期由於程式碼優化，這段邏輯引入了多執行緒併發執行，在一個未知的時間點，會發現CPU佔用100%，居高不下，通過檢視堆疊，你會驚訝的發現，執行緒都Hang在hashMap的get()方法上，服務重啟之後，問題消失，過段時間可能又復現了。

這是為什麼？

原因分析

在瞭解來龍去脈之前，我們先看看HashMap的資料結構。

在內部，HashMap使用一個Entry陣列儲存key、value資料，當一對key、value被加入時，會通過一個hash演算法得到陣列的下標index，演算法很簡單，根據key的hash值，對陣列的大小取模 hash & (length-1)，並把結果插入陣列該位置，如果該位置上已經有元素了，就說明存在hash衝突，這樣會在index位置生成連結串列。

如果存在hash衝突，最慘的情況，就是所有元素都定位到同一個位置，形成一個長長的連結串列，這樣get一個值時，最壞情況需要遍歷所有節點，效能變成了O(n)，所以元素的hash值演算法和HashMap的初始化大小很重要。

當插入一個新的節點時，如果不存在相同的key，則會判斷當前內部元素是否已經達到閾值（預設是陣列大小的0.75），如果已經達到閾值，會對陣列進行擴容，也會對連結串列中的元素進行rehash。

實現

HashMap的put方法實現：

1、判斷key是否已經存在

public V put(K key, V value) {
    if (key == null)
        return putForNullKey(value);
    int hash = hash(key);
    int i = indexFor(hash, table.length);
    // 如果key已經存在，則替換value，並返回舊值
    for (Entry<K,V> e = table[i]; e != null; e = e.next) {
        Object k;
        if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
            V oldValue = e.value;
            e.value = value;
            e.recordAccess(this);
            return oldValue;
        }
    }

    modCount++;
    // key不存在，則插入新的元素
    addEntry(hash, key, value, i);
    return null;
}

2、檢查容量是否達到閾值threshold

void addEntry(int hash, K key, V value, int bucketIndex) {
    if ((size >= threshold) && (null != table[bucketIndex])) {
        resize(2 * table.length);
        hash = (null != key) ? hash(key) : 0;
        bucketIndex = indexFor(hash, table.length);
    }

    createEntry(hash, key, value, bucketIndex);
}

如果元素個數已經達到閾值，則擴容，並把原來的元素移動過去。

3、擴容實現

void resize(int newCapacity) {
    Entry[] oldTable = table;
    int oldCapacity = oldTable.length;
    ...

    Entry[] newTable = new Entry[newCapacity];
    ...
    transfer(newTable, rehash);
    table = newTable;
    threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1);
}

這裡會新建一個更大的陣列，並通過transfer方法，移動元素。

void transfer(Entry[] newTable, boolean rehash) {
    int newCapacity = newTable.length;
    for (Entry<K,V> e : table) {
        while(null != e) {
            Entry<K,V> next = e.next;
            if (rehash) {
                e.hash = null == e.key ? 0 : hash(e.key);
            }
            int i = indexFor(e.hash, newCapacity);
            e.next = newTable[i];
            newTable[i] = e;
            e = next;
        }
    }
}

移動的邏輯也很清晰，遍歷原來table中每個位置的連結串列，並對每個元素進行重新hash，在新的newTable找到歸宿，並插入。

案例分析

假設HashMap初始化大小為4，插入個3節點，不巧的是，這3個節點都hash到同一個位置，如果按照預設的負載因子的話，插入第3個節點就會擴容，為了驗證效果，假設負載因子是1.

void transfer(Entry[] newTable, boolean rehash) {
    int newCapacity = newTable.length;
    for (Entry<K,V> e : table) {
        while(null != e) {
            Entry<K,V> next = e.next;
            if (rehash) {
                e.hash = null == e.key ? 0 : hash(e.key);
            }
            int i = indexFor(e.hash, newCapacity);
            e.next = newTable[i];
            newTable[i] = e;
            e = next;
        }
    }
}

以上是節點移動的相關邏輯。

插入第4個節點時，發生rehash，假設現在有兩個執行緒同時進行，執行緒1和執行緒2，兩個執行緒都會新建新的陣列。

假設 執行緒2 在執行到Entry<K,V> next = e.next;之後，cpu時間片用完了，這時變數e指向節點a，變數next指向節點b。

執行緒1繼續執行，很不巧，a、b、c節點rehash之後又是在同一個位置7，開始移動節點

第一步，移動節點a

第二步，移動節點b

注意，這裡的順序是反過來的，繼續移動節點c

這個時候 執行緒1 的時間片用完，內部的table還沒有設定成新的newTable， 執行緒2 開始執行，這時內部的引用關係如下：

這時，在 執行緒2 中，變數e指向節點a，變數next指向節點b，開始執行迴圈體的剩餘邏輯。

Entry<K,V> next = e.next;
int i = indexFor(e.hash, newCapacity);
e.next = newTable[i];
newTable[i] = e;
e = next;

執行之後的引用關係如下圖

執行後，變數e指向節點b，因為e不是null，則繼續執行迴圈體，執行後的引用關係

變數e又重新指回節點a，只能繼續執行迴圈體，這裡仔細分析下：
1、執行完Entry<K,V> next = e.next;，目前節點a沒有next，所以變數next指向null；
2、e.next = newTable[i]; 其中 newTable[i] 指向節點b，那就是把a的next指向了節點b，這樣a和b就相互引用了，形成了一個環；
3、newTable[i] = e 把節點a放到了陣列i位置；
4、e = next; 把變數e賦值為null，因為第一步中變數next就是指向null；

所以最終的引用關係是這樣的：

節點a和b互相引用，形成了一個環，當在陣列該位置get尋找對應的key時，就發生了死迴圈。

另外，如果執行緒2把newTable設定成到內部的table，節點c的資料就丟了，看來還有資料遺失的問題。

總結

所以在併發的情況，發生擴容時，可能會產生迴圈連結串列，在執行get的時候，會觸發死迴圈，引起CPU的100%問題，所以一定要避免在併發環境下使用HashMap。

曾經有人把這個問題報給了Sun，不過Sun不認為這是一個bug，因為在HashMap本來就不支援多執行緒使用，要併發就

老生常談，HashMap的死迴圈

問題

原因分析

實現

案例分析

總結

老生常談，HashMap的死迴圈

hashmap為什麼執行緒不安全，出現死迴圈

request.getRequestDispatcher(url)使用後天一直報錯，進入死迴圈

C語言 - while迴圈體內變數重新宣告，陷入死迴圈。

jstack簡單使用，定位死迴圈、執行緒阻塞、死鎖等問題

微信開發者工具初始化專案時，進去報錯：小程式重啟耗時過久，請確認業務邏輯中是否有複雜運算，或者死迴圈

定義一個數組，陣列初始長度由控制檯獲取。隨後手動給陣列中每個元素賦值，陣列滿後將陣列長度擴充二倍並輸出，清空陣列中所有元素且值繼承陣列長度，並重新進行手動新增元素，無限死迴圈直至輸出-0後結束程式。

問題：在程式中儲存資料到索引庫，發生異常jackson資料轉換異常，造成死迴圈棧溢位解決@JsonIgnore註解

Java併發容器ConcurrentHashMap原理及HashMap死迴圈原因的分析

HashMap死迴圈記錄

Vue 之vue-router router.beforeEach導航守衛，陷入死迴圈

微信小程式報錯：小程式重啟耗時過久，請確認業務邏輯中是否有複雜運算，或者死迴圈的解決

踩坑了，JDK8中HashMap依然會死迴圈！

多執行緒下HashMap的死迴圈

HashMap的死迴圈解析

1024這天，我故意寫了個死迴圈~

ubantu系統修改許可權失敗，導致只能客人會話登入解決辦法 ubantu系統出現登入介面死迴圈處理辦法 ubantu系統出現登入介面死迴圈處理辦法

ubantu系統出現登入介面死迴圈處理辦法 ubantu系統修改許可權失敗，導致只能客人會話登入解決辦法

Java HashMap的死迴圈

HashMap多執行緒環境下的死迴圈問題解釋

老生常談，HashMap的死迴圈

問題

原因分析

實現

案例分析

總結

相關推薦