hashmap技術概覽與擴容在Java7與Java8中的不同實現

阿新 • • 發佈：2018-11-12

hashmap技術概覽：

由陣列 + 連結串列的方式實現，當hash衝突的時候，會將新put值放到連結串列開頭。

初始化時會初始化容量(capacity)、載入因子(loadfactor)、閾值(threshold)，其中threshold = capacity * loadfactor，預設值分別是：12 = 16*0.75。

當count值大於等於閾值（threshold）時，會進行動態擴容，擴容時擴容成原來容量（capacity）的兩倍，並對每個值進行重定位。

Java8後對連結串列進行了優化，如果連結串列長度超過8，會將連結串列變成紅黑樹

。

HashMap大部分的內容是比較好理解的，連結串列的實現是通過一個內部類Node<K,V>實現的：

//實現自Map.Entry<K,V>介面，包含當前值的hash值、key、value、next節點的指標
static class Node<K,V> implements Map.Entry<K,V> {
        final int hash;
        final K key;
        V value;
        Node<K,V> next;
        //... 省略 ... 

}

這裡我們主要說下在動態擴容時hashmap是怎麼實現的，Java8引入了紅黑樹，擴容方式也換了另一個方法，所以程式碼實現比Java7複雜了不止一倍，但本質差別不大，我們先從7的擴容程式碼resize()來理解擴容的重新定位是如何實現的：

void resize(int newCapacity) {   //傳入新的容量  
    Entry[] oldTable = table;    //引用擴容前的Entry陣列  
    int oldCapacity = oldTable.length;  
    if (oldCapacity == MAXIMUM_CAPACITY) {  //擴容前的陣列大小如果已經達到最大(2^30)了   

        threshold = Integer.MAX_VALUE; //修改閾值為int的最大值(2^31-1)，這樣以後就不會擴容了  
        return;  
    }  

    Entry[] newTable = new Entry[newCapacity];  //初始化一個新的Entry陣列
    transfer(newTable);                         //！！將資料轉移到新的Entry數組裡，這裡包含最重要的重新定位
    table = newTable;                           //HashMap的table屬性引用新的Entry陣列
    threshold = (int) (newCapacity * loadFactor);//修改閾值  
}

//遍歷每個元素，按新的容量進行rehash，放到新的陣列上
void transfer(Entry[] newTable) {  
    Entry[] src = table;                   //src引用了舊的Entry陣列  
    int newCapacity = newTable.length;  
    for (int j = 0; j < src.length; j++) { //遍歷舊的Entry陣列  
        Entry<K, V> e = src[j];             //取得舊Entry陣列的每個元素  
        if (e != null) {  
            src[j] = null;//釋放舊Entry陣列的物件引用（for迴圈後，舊的Entry陣列不再引用任何物件）  
            do {  
                Entry<K, V> next = e.next;  
                int i = indexFor(e.hash, newCapacity); //！！重新計算每個元素在陣列中的位置  
                e.next = newTable[i]; //標記[1]  
                newTable[i] = e;      //將元素放在陣列上  
                e = next;             //訪問下一個Entry鏈上的元素  
            } while (e != null);  
        }  
    }  
}

//呼叫傳入hash值和容量，如：indexFor(e.hash, newCapacity)
static int indexFor(int h, int length) {  
    return h & (length - 1);  //進行與操作，求出，這樣比%求模快，這也是hashmap的容量都是2的次方的原因之一。
}

其中的雜湊桶陣列table的size=2，所以key = 3、7、5，put順序依次為 5、7、3。在mod 2以後都衝突在table[1]這裡了。這裡假設負載因子 loadFactor=1，即當鍵值對的實際大小size 大於 table的實際大小時進行擴容。接下來的三個步驟是雜湊桶陣列 resize成4，然後所有的Node重新rehash的過程。

這裡寫圖片描述

我們再來看下JDK1.8做了哪些優化。經過觀測可以發現，我們使用的是2次冪的擴充套件(指長度擴為原來2倍)，所以，經過rehash之後，元素的位置要麼是在原位置，要麼是在原位置再移動2次冪的位置。對應的就是下方的resize()的註釋。
看下圖可以明白這句話的意思，n為table的長度，圖（a）表示擴容前的key1和key2兩種key確定索引位置的示例，圖（b）表示擴容後key1和key2兩種key確定索引位置的示例，其中hash1是key1對應的雜湊與高位運算結果。

元素在重新計算hash之後，因為n變為2倍，那麼n-1的mask範圍在高位多1bit(紅色)，因此新的index就會發生這樣的變化：

因此，我們在擴充HashMap的時候，不需要像JDK1.7的實現那樣重新計算hash，只需要看看原來的hash值新增的那個bit是1還是0就好了，是0的話索引沒變，是1的話索引變成“原索引+oldCap”，可以看看下圖為16擴充為32的resize示意圖

這個設計確實非常的巧妙，既省去了重新計算hash值的時間，而且同時，由於新增的1bit是0還是1可以認為是隨機的，因此resize的過程，均勻的把之前的衝突的節點分散到新的bucket了。這一塊就是JDK1.8新增的優化點。有一點注意區別，JDK1.7中rehash的時候，舊連結串列遷移新連結串列的時候，如果在新表的陣列索引位置相同，則連結串列元素會倒置，但是從上圖可以看出，JDK1.8不會倒置。

Java8 resize()原始碼：

final Node<K,V>[] resize() {
        Node<K,V>[] oldTab = table;  //引用擴容前的node陣列
        int oldCap = (oldTab == null) ? 0 : oldTab.length;  //舊的容量
        int oldThr = threshold;  //舊的閾值
        int newCap, newThr = 0;  //新的容量、閾值初始化為0
        if (oldCap > 0) {
            if (oldCap >= MAXIMUM_CAPACITY) {  //如果舊容量已經超過最大容量，讓閾值也等於最大容量，以後不再擴容
                threshold = Integer.MAX_VALUE;
                return oldTab;
            }
            else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                     oldCap >= DEFAULT_INITIAL_CAPACITY)  //如果舊容量翻倍沒有超過最大值，且舊容量不小於初始化容量16，則翻倍
                newThr = oldThr << 1; // double threshold
        }
        else if (oldThr > 0) // initial capacity was placed in threshold - 初始化容量設定為閾值
            newCap = oldThr;
        else {               // zero initial threshold signifies using defaults - 0的時候使用預設值初始化
            newCap = DEFAULT_INITIAL_CAPACITY;
            newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
        }
        if (newThr == 0) {  //計算新閾值，如果新容量或新閾值大於等於最大容量，則直接使用最大值作為閾值，不再擴容
            float ft = (float)newCap * loadFactor;
            newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                      (int)ft : Integer.MAX_VALUE);
        }
        threshold = newThr;  //設定新閾值
        @SuppressWarnings({"rawtypes","unchecked"})
            Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
        table = newTab;  //建立新的陣列，並引用
        //如果老的陣列有資料，也就是是擴容而不是初始化，才執行下面的程式碼，否則初始化的到這裡就可以結束了
        if (oldTab != null) {
            for (int j = 0; j < oldCap; ++j) {  //輪詢老陣列所有資料
                Node<K,V> e;  //以一個新的節點引用當前節點，然後釋放原來的節點的引用
                if ((e = oldTab[j]) != null) {
                    oldTab[j] = null;
                    if (e.next == null)  //如果e沒有next節點，證明這個節點上沒有hash衝突，則直接把e的引用給到新的陣列位置上
                        newTab[e.hash & (newCap - 1)] = e;
                    else if (e instanceof TreeNode)
                        ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);   //！！！如果是紅黑樹，則進行分裂
                    else { // preserve order
                        Node<K,V> loHead = null, loTail = null;
                        Node<K,V> hiHead = null, hiTail = null;
                        Node<K,V> next;
                        do {  //從這條連結串列上第一個元素開始輪詢，如果當前元素新增的bit是0，則放在當前這條連結串列上，如果是1，則放在"j+oldcap"這個位置上，生成“低位”和“高位”兩個連結串列
                            next = e.next;
                            if ((e.hash & oldCap) == 0) {
                                if (loTail == null)
                                    loHead = e;
                                else
                                    loTail.next = e;  //元素是不斷的加到尾部的，不會像1.7裡面一樣會倒序
                                loTail = e;  //新增的元素永遠是尾元素
                            }
                            else {  //高位的連結串列與地位的連結串列處理邏輯一樣，不斷的把元素加到連結串列尾部
                                if (hiTail == null)
                                    hiHead = e;
                                else
                                    hiTail.next = e;
                                hiTail = e;
                            }
                        } while ((e = next) != null);
                        if (loTail != null) {  //低位連結串列放到j這個索引的位置上
                            loTail.next = null;
                            newTab[j] = loHead;
                        }
                        if (hiTail != null) { //高位連結串列放到(j+oldCap)這個索引的位置上
                            hiTail.next = null;
                            newTab[j + oldCap] = hiHead;
                        }
                    }
                }
            }
        }
        return newTab;
    }

從這裡看，如果沒有紅黑樹，其實1.7與1.8處理邏輯大同小異，區別主要還是在樹節點的分裂((TreeNode<K,V>)e).split() 這個方法上。

//resize時呼叫((TreeNode<K,V>)e).split(this, newTab, j, oldCap);對樹進行擴容或縮容，如果低於閾值會變成連結串列
/**
 * Splits nodes in a tree bin into lower and upper tree bins,
 * or untreeifies if now too small. Called only from resize;
 * see above discussion about split bits and indices.
 *
 * @param map the map
 * @param tab the table for recording bin heads
 * @param index the index of the table being split
 * @param bit the bit of hash to split on
 */
final void split(HashMap<K,V> map, Node<K,V>[] tab, int index, int bit) {
    TreeNode<K,V> b = this;  //當前這個節點的引用，即這個索引上的樹的根節點
    // Relink into lo and hi lists, preserving order
    TreeNode<K,V> loHead = null, loTail = null;
    TreeNode<K,V> hiHead = null, hiTail = null;
    int lc = 0, hc = 0;  //高位低位的初始樹節點個數都設成0
    for (TreeNode<K,V> e = b, next; e != null; e = next) {
        next = (TreeNode<K,V>)e.next;
        e.next = null;
        if ((e.hash & bit) == 0) {  //bit=oldcap,這裡判斷新bit位是0還是1，如果是0就放在低位樹上，如果是1就放在高位樹上，這裡先是一個雙向連結串列
            if ((e.prev = loTail) == null)
                loHead = e;
            else
                loTail.next = e;
            loTail = e;
            ++lc;
        }
        else {
            if ((e.prev = hiTail) == null)
                hiHead = e;
            else
                hiTail.next = e;
            hiTail = e;
            ++hc;
        }
    }

    if (loHead != null) {
        if (lc <= UNTREEIFY_THRESHOLD)
            tab[index] = loHead.untreeify(map);  //！！！如果低位的連結串列長度小於閾值6，則把樹變成連結串列，並放到新陣列中j索引位置
        else {
            tab[index] = loHead;
            if (hiHead != null) // (else is already treeified)如果高位樹是空，即整個樹沒變化，那麼樹其實是不用重新調整的
                loHead.treeify(tab);
        }
    }
    if (hiHead != null) {
        if (hc <= UNTREEIFY_THRESHOLD)
            tab[index + bit] = hiHead.untreeify(map);
        else {
            tab[index + bit] = hiHead;
            if (loHead != null)
                hiHead.treeify(tab);
        }
    }
}

//樹轉變為單向連結串列
final Node<K,V> untreeify(HashMap<K,V> map) {
    Node<K,V> hd = null, tl = null;
    for (Node<K,V> q = this; q != null; q = q.next) {
        Node<K,V> p = map.replacementNode(q, null);
        if (tl == null)
            hd = p;
        else
            tl.next = p;
        tl = p;
    }
    return hd;
}

//連結串列轉換為紅黑樹，會根據紅黑樹特性進行平衡、左旋、右旋等
//TODO 這裡不細講了，後續我會寫一篇部落格專講紅黑樹在這裡的實現
final void treeify(Node<K,V>[] tab) {
    TreeNode<K,V> root = null;
    for (TreeNode<K,V> x = this, next; x != null; x = next) {
        next = (TreeNode<K,V>)x.next;
        x.left = x.right = null;
        if (root == null) {
            x.parent = null;
            x.red = false;
            root = x;
        }
        else {
            K k = x.key;
            int h = x.hash;
            Class<?> kc = null;
            for (TreeNode<K,V> p = root;;) {
                int dir, ph;
                K pk = p.key;
                if ((ph = p.hash) > h)
                    dir = -1;
                else if (ph < h)
                    dir = 1;
                else if ((kc == null &&
                          (kc = comparableClassFor(k)) == null) ||
                         (dir = compareComparables(kc, k, pk)) == 0)
                    dir = tieBreakOrder(k, pk);

                TreeNode<K,V> xp = p;
                if ((p = (dir <= 0) ? p.left : p.right) == null) {
                    x.parent = xp;
                    if (dir <= 0)
                        xp.left = x;
                    else
                        xp.right = x;
                    root = balanceInsertion(root, x);//對樹進行平衡插入，裡面包括左旋右旋等操作
                    break;
                }
            }
        }
    }
    moveRootToFront(tab, root);
}

hashmap技術概覽與擴容在Java7與Java8中的不同實現

hashmap技術概覽：由陣列 + 連結串列的方式實現，當hash衝突的時候，會將新put值放到連結串列開頭。初始化時會初始化容量(capacity)、載入因子(loadfactor)、閾值(threshold)，其中threshold = capaci

JDK8的GC型別與高併發生產環境中不同GC型別帶來的效能提升

記一次專案中，在JDK8環境下，並行GC月併發GC在Restful介面中體現差異。當今國內第三大流量電商(某多多)，博主所在公司在前一段時間和他們有產品合作，他們對我們產品提出了非常嚴格的要求：一分鐘時間範圍內介面響應時間大於300MS的

資料結構與演算法-->冪運算的不同實現

package test; public class Miyunsuan { public static void main(String[] args) { System.out.println(pow2(2,4)); } /** * 普通遞迴演

Java7 和 Java8 中的 ConcurrentHashMap 原理解析

equal 折騰結束控制頭部組成相對與操作完數 Java7 中 ConcurrentHashMap ConcurrentHashMap 和 HashMap 思路是差不多的，但是因為它支持並發操作，所以要復雜一些。整個 ConcurrentHashMap 由一

Java基礎（十一）:用Java8中Stream實現不同集合過濾

【前言】從開源中國的對Java各個版本使用投票可以看出，目前Java8還是以67%的壓倒性優勢遙遙領先（Java 11 已正式釋出，你在使用 Java 的哪個版本？）；眾所周知，Stream是Java8中的一大亮點，現在分享一下自己在工作中用它解決一個需求。

JAVA 方法區與堆--java7前，java7,java8各不相同

三種情況： java7之前，方法區位於永久代(PermGen)，永久代和堆相互隔離，永久代的大小在啟動JVM時可以設定一個固定值，不可變； java7中，儲存在永久代的部分資料就已經轉移到Java Heap或者Native memory。但永久代仍存在於JDK 1.7中，並沒有完全移

HashMap的容量與擴容

有幾個重要的常量：static final int DEFAULT_INITIAL_CAPACITY = 1 << 4;//預設的桶陣列大小 static final int MAXIMUM_CAPACITY = 1 << 30;//極限值（超過這個值就將threshold修改為Int

HashMap原始碼學習——容量與擴容resize

1.相關常量 static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; //預設初始容量：初始桶數。 static final int MAXIMUM_CAPACITY = 1 << 30

HashMap為什麼執行緒不安全(hash碰撞與擴容導致)

一直以來都知道HashMap是執行緒不安全的，但是到底為什麼執行緒不安全，在多執行緒操作情況下什麼時候執行緒不安全？讓我們先來了解一下HashMap的底層儲存結構，HashMap底層是一個Entry陣列，一旦發生Hash衝突的的時候，HashMap採用拉鍊法解決碰撞衝突，Entry內部的變數： fi

HashMap 中的容量與擴容實現，細緻入微，值的一品！

前言　　開心一刻　　　　　　巴閉，你的腳怎麼會有味道，我要聞聞看是不是好吃的，嗯~~爸比你的腳臭死啦！！ …… 高手過招，招招致命　　JDK1.8 中 HashMap 的底層實現，我相信大家都能說上來個一二，底層資料結構陣列 + 連結串列（或紅黑樹）

《大型網站技術架構：核心原理與案例分析》-- 讀書筆記 (5) ：網購秒殺系統

案例並發刷新隨機 url 對策 -- 技術動態生成 1. 秒殺活動的技術挑戰及應對策略 1.1 對現有網站業務造成沖擊秒殺活動具有時間短，並發訪問量大的特點，必然會對現有業務造成沖擊。對策：秒殺系統獨立部署 1.2 高並發下的應用、

對象識別技術將完美融入AR與VR領域

拍攝 title 虛擬好處通道跨國公司名稱電話效率原文標題：對象識別技術將完美融入AR與VR領域隨著三星Bixby這樣的人工智能數字助手的推出，我們可以預計智能手機將不再局限於發信息、打電話、或進行娛樂活動。它們可以幫助我們更快地完成任務。通過語音命令數字助

Java加密技術（一）——BASE64與單向加密算法MD5&SHA&MAC

sha256 integer 被人 sent 發現 Coding design 如果 targe http://snowolf.iteye.com/blog/379860 加密解密，曾經是我一個畢業設計的重要組件。在工作了多年以後回想當時那個加密、解密算法，實在是太單

《大型網站技術架構：核心原理與案例分析》【PDF】下載

優化均衡 1.7 3.3 架設框架應用服務器博客分布式服務框架《大型網站技術架構：核心原理與案例分析》【PDF】下載鏈接: https://u253469.pipipan.com/fs/253469-230062557 內容簡介本書通過梳理大型網站技

Spring Security技術棧開發企業級認證與授權

iyu 復雜 sha 日誌開發app 一個核心概念並發自動 Spring Security技術棧開發企業級認證與授權網盤地址：https://pan.baidu.com/s/1mj8u6JQ 密碼: 92rp備用地址（騰訊微雲）：https://share.weiy

閱讀《大型網站技術架構：核心原理與案例分析》第五、六、七章，結合《河北省重大技術需求征集系統》，列舉實例分析采用的可用性和可修改性戰術

定時並不會表現做出 span class 硬件進行情況　　網站的可用性描述網站可有效訪問的特性，網站的頁面能完整呈現在用戶面前，需要經過很多個環節，任何一個環節出了問題，都可能導致網站頁面不可訪問。可用性指標是網站架構設計的重要指標，對外是服務承諾，對內是考核指

《大型網站技術架構：核心原理與案例分析》結合需求征集系統分析

運行模塊正常一致性hash 產品進行 OS 很多層次閱讀《大型網站技術架構：核心原理與案例分析》第五、六、七章，結合《河北省重大技術需求征集系統》，列舉實例分析采用的可用性和可修改性戰術，將上述內容撰寫成一篇1500字左右的博客闡述你的觀點。閱

《大型網站技術架構：核心原理與案例分析》讀後感

TP bubuko 一個 nbsp 分享架構優化技術分享 src 李智慧的著作《大型網站技術架構：核心原理與案例分析》，寫得非常好，本著學習的態度，對於書中的關於性能優化的講解做了一個思維導圖，供大家梳理思路和學習之用。拋磚引玉。《大型網站技術架構

Java多線程核心技術(五)單例模式與多線程

otf 實現 https 但是 not hashcode int 線程編程代碼包本文只需要考慮一件事：如何使單例模式遇到多線程是安全的、正確的 1.立即加載 / "餓漢模式" 什麽是立即加載？立即加載就是使用類的時候已經將對象創建完畢，常見的實現

《大型網站技術架構之核心原理與案例分析》讀書筆記

架構！對於工作經驗尚淺的我是理應遠遠不用考慮的倆字。不過就像這本書所說到的一個好的網站架構體系，不僅僅是架構師個人的架構，而是和參與共同建設的人共同貢獻，讓參與的人覺得自己是架構體系的建設者之一，就越是自動承擔開發過程的責任和共同維護架構和改善軟體。

hashmap技術概覽與擴容在Java7與Java8中的不同實現

相關推薦