Java常見集合的默認大小及擴容機制

阿新 • • 發佈：2018-09-19

數組長度 pan 減少 hashmap 代碼這就是整數一段 span

在面試後臺開發的過程中，集合是面試的熱話題，不僅要知道各集合的區別用法，還要知道集合的擴容機制，今天我們就來談下ArrayList 和 HashMap的默認大小以及擴容機制。

在 Java 7 中，查看源碼可以知道：ArrayList 的默認大小是 10 個元素，HashMap 的默認大小是16個元素（必須是2的冪，為什麽呢？？？下文有解釋）。這就是 Java 7 中 ArrayList 和 HashMap 類的代碼片段：

// from ArrayList.java JDK 1.7
private static final int DEFAULT_CAPACITY = 10;
 
//from HashMap.java JDK 7 

static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16

這裏要討論這些常用的默認初始容量和擴容的原因是：

當底層實現涉及到擴容時，容器或重新分配一段更大的連續內存（如果是離散分配則不需要重新分配，離散分配都是插入新元素時動態分配內存），要將容器原來的數據全部復制到新的內存上，

這無疑使效率大大降低。加載因子的系數小於等於1，意指即當元素個數超過容量長度*加載因子的系數時，進行擴容。另外，擴容也是有默認的倍數的，不同的容器擴容情況不同。

List 元素是有序的、可重復

ArrayList、Vector默認初始容量為10

Vector：線程安全，但速度慢

　　　　底層數據結構是數組結構

　　　　加載因子為1：即當元素個數超過容量長度時，進行擴容

　　　　擴容增量：原容量的 1倍

　　　　　　如 Vector的容量為10，一次擴容後是容量為20

ArrayList：線程不安全，查詢速度快

　　　　底層數據結構是數組結構

　　　　擴容增量：原容量的 0.5倍+1

　　　　　　如 ArrayList的容量為10，一次擴容後是容量為16

Set(集) 元素無序的、不可重復。

HashSet：線程不安全，存取速度快

　　　　　底層實現是一個HashMap（保存數據），實現Set接口

　　　　　默認初始容量為16（為何是16，見下方對HashMap的描述）

　　　　　加載因子為0.75：即當元素個數超過容量長度的0.75倍時，進行擴容

　　　　　擴容增量：原容量的 1 倍

　　　　　　如 HashSet的容量為16，一次擴容後是容量為32

Map是一個雙列集合

HashMap：默認初始容量為16

　　　　　（為何是16：16是2^4，可以提高查詢效率，另外，32=16<<1）

　　　　　加載因子為0.75：即當元素個數超過容量長度的0.75倍時，進行擴容

　　　　　擴容增量：原容量的 1 倍

　　　　　　如 HashSet的容量為16，一次擴容後是容量為32

接下來我們來談談hashMap的數組長度為什麽保持2的次冪？

hashMap的數組長度一定保持2的次冪，比如16的二進制表示為 10000，那麽length-1就是15，二進制為01111，同理擴容後的數組長度為32，二進制表示為100000，length-1為31，二進制表示為011111。

這樣會保證低位全為1，而擴容後只有一位差異，也就是多出了最左位的1，這樣在通過 h&(length-1)的時候，只要h對應的最左邊的那一個差異位為0，就能保證得到的新的數組索引和老數組索引一致(大大減少了

之前已經散列良好的老數組的數據位置重新調換)，還有，數組長度保持2的次冪，length-1的低位都為1，會使得獲得的數組索引index更加均勻。

1.    static int indexFor(int h, int length) {  
2.           return h & (length-1);  
3.    }

首先算得key得hashcode值，然後跟數組的長度-1做一次“與”運算（&）。看上去很簡單，其實比較有玄機。比如數組的長度是2的4次方，那麽hashcode就會和2的4次方-1做“與”運算。很多人都有這個疑問，

為什麽hashmap的數組初始化大小都是2的次方大小時，hashmap的效率最高，我以2的4次方舉例，來解釋一下為什麽數組大小為2的冪時hashmap訪問的性能最高。

看下圖，左邊兩組是數組長度為16（2的4次方），右邊兩組是數組長度為15。兩組的hashcode均為8和9，但是很明顯，當它們和1110“與”的時候，產生了相同的結果，也就是說它們會定位到數組中的同

一個位置上去，這就產生了碰撞，8和9會被放到同一個鏈表上，那麽查詢的時候就需要遍歷這個鏈表，得到8或者9，這樣就降低了查詢的效率。同時，我們也可以發現，當數組長度為15的時候，hashcode的

值會與14（1110）進行“與”，那麽最後一位永遠是0，而0001，0011，0101，1001，1011，0111，1101這幾個位置永遠都不能存放元素了，空間浪費相當大，更糟的是這種情況中，數組可以使用的位置比數組

長度小了很多，這意味著進一步增加了碰撞的幾率，減慢了查詢的效率！

技術分享圖片

所以說，當數組長度為2的n次冪的時候，不同的key算得得index相同的幾率較小，那麽數據在數組上分布就比較均勻，也就是說碰撞的幾率小，相對的，查詢的時候就不用遍歷某個位置上的鏈表，這樣查詢效率也就較高了。

說到這裏，我們再回頭看一下hashmap中默認的數組大小是多少，查看源代碼可以得知是16，為什麽是16，而不是15，也不是20呢，看到上面的解釋之後我們就清楚了吧，顯然是因為16是2的整數次冪的原因，

在小數據量的情況下16比15和20更能減少key之間的碰撞，而加快查詢的效率。

Java常見集合的默認大小及擴容機制

數組長度 pan 減少 hashmap 代碼這就是整數一段 span 在面試後臺開發的過程中，集合是面試的熱話題，不僅要知道各集合的區別用法，還要知道集合的擴容機制，今天我們就來談下ArrayList 和 HashMap的默認大小以及擴容機制。在 Java 7 中，

Java常見集合的默認大小及擴容機制

接下來我們來談談hashMap的數組長度為什麽保持2的次冪？

Java常見集合的默認大小及擴容機制

CRT的默認顏色及字體更改

ubuntu下root用戶默認密碼及修改方法

移動端一些常見的默認樣式問題

ArrayList 和 HashMap 的默認大小是多數？

取消默認事件及冒泡

OneExerciseOne創建一個類，它包含一個int域，一個char域，他們都沒有初始化,驗證Java執行了默認初始化

java面試/筆試題目之Java常見集合(持續更新中)

<select>標簽的默認顯示及<option>中的selected屬性結合使用

Java集合——HashMap（四）擴容機制——resize（）

Java常見集合框架(十六)：Queue之DelayQueue、PriorityQueue、PriorityBlockingQueue

Java常見的記憶體溢位異常及解決方法

Java常見集合框架(二):Iterable、Collection(List、Set、Queue)、AbstractCollection

【Linux】常見Linux默認的shell

java常見集合

瀏覽器裏常用的默認事件及事件的屬性

Java常見異常類含義與異常處理機制

ArrayList,HashMap,LinkedList 初始化大小和擴容機制

JAVA中初始化及默認值，包裝類與基本類型

Linux部署禪道及默認端口修改和附件大小限制修改和使用過程各種排坑

Java常見集合的默認大小及擴容機制

接下來我們來談談hashMap的數組長度為什麽保持2的次冪？

相關推薦