HashMap 相關面試題及其解答
Q:HashMap 的資料結構?
A:雜湊表結構(連結串列雜湊:陣列+連結串列)實現,結合陣列和連結串列的優點。當連結串列長度超過 8 時,連結串列轉換為紅黑樹。
transient Node[] table;
Q:HashMap 的工作原理?
A:HashMap 底層是 hash 陣列和單向連結串列實現,陣列中的每個元素都是連結串列,由 Node 內部類(實現 Map.Entry 介面)實現,HashMap 通過 put & get 方法儲存和獲取。
儲存物件時,將 K/V 鍵值傳給 put() 方法:①、呼叫 hash(K) 方法計算 K 的 hash 值
③、i.如果 K 的 hash 值在 HashMap 中不存在,則執行插入,若存在,則發生碰撞;
ii.如果 K 的 hash 值在 HashMap 中存在,且它們兩者 equals 返回 true,則更新鍵值對;
iii. 如果 K 的 hash 值在 HashMap 中存在,且它們兩者 equals 返回 false,則插入連結串列的尾部或者紅黑樹中。
(JDK 1.7 之前使用頭插法、JDK 1.8 使用尾插法)
(注意:當碰撞導致連結串列大於 TREEIFY_THRESHOLD = 8 時,就把連結串列轉換成紅黑樹)
獲取物件時,將 K 傳給 get() 方法:①、呼叫 hash(K) 方法(計算 K 的 hash 值)從而獲取該鍵值所在連結串列的陣列下標;②、順序遍歷連結串列,equals()方法查詢相同 Node 連結串列中 K 值對應的 V 值。
hashCode 是定位的,儲存位置;equals是定性的,比較兩者是否相等
Q:當兩個物件的 hashCode 相同會發生什麼?
A:因為 hashCode 相同,不一定就是相等的(equals方法比較),所以兩個物件所在陣列的下標相同,“碰撞”就此發生。又因為 HashMap 使用連結串列儲存物件,這個 Node 會儲存到連結串列中。
Q:你知道 hash 的實現嗎?為什麼要這樣實現?
A:JDK 1.8 中,是通過 hashCode() 的高 16 位異或低 16 位實現的:(h = k.hashCode()) ^ (h >>> 16),主要是從速度,功效和質量來考慮的,減少系統的開銷,也不會造成因為高位沒有參與下標的計算,從而引起的碰撞。
Q:HashMap 的 table 的容量如何確定?loadFactor 是什麼? 該容量如何變化?這種變化會帶來什麼問題?
A:①、table 陣列大小是由 capacity 這個引數確定的,預設是16,也可以構造時傳入,最大限制是1<<30;
②、loadFactor 是裝載因子,主要目的是用來確認table 陣列是否需要動態擴充套件,預設值是0.75,比如table 陣列大小為 16,裝載因子為 0.75 時,threshold 就是12,當 table 的實際大小超過 12 時,table就需要動態擴容;
③、擴容時,呼叫 resize() 方法,將 table 長度變為原來的兩倍(注意是 table 長度,而不是 threshold)
④、如果資料很大的情況下,擴充套件時將會帶來效能的損失,在效能要求很高的地方,這種損失很可能很致命。
Q:HashMap 的遍歷方式及其效能對比
A:主要四種方式:
NO.1:for-each map.keySet() – 只需要K值的時候,推薦使用
for (String key : map.keySet()) {
map.get(key);
}
NO.2:for-each map.entrySet() – 當需要V值的時候,推薦使用
for (Map.Entry<String, String> entry : map.entrySet()) {
entry.getKey();
entry.getValue();
}
NO.3:for-each map.entrySet() + 臨時變數
Set<Map.Entry<String, String>> entrySet = map.entrySet();
for (Map.Entry<String, String> entry : entrySet) {
entry.getKey();
entry.getValue();
}
NO.4:for-each map.entrySet().iterator()
Iterator<Map.Entry<String, String>> iterator = map.entrySet().iterator();
while (iterator.hasNext()) {
Map.Entry<String, String> entry = iterator.next();
entry.getKey();
entry.getValue();
}
Q:HashMap,LinkedHashMap,TreeMap 有什麼區別?
A:HashMap 參考其他問題;
LinkedHashMap 儲存了記錄的插入順序,在用 Iterator 遍歷時,先取到的記錄肯定是先插入的;遍歷比 HashMap 慢;
TreeMap 實現 SortMap 介面,能夠把它儲存的記錄根據鍵排序(預設按鍵值升序排序,也可以指定排序的比較器)
Q:HashMap & TreeMap & LinkedHashMap 使用場景?
A:一般情況下,使用最多的是 HashMap。
HashMap:在 Map 中插入、刪除和定位元素時;
TreeMap:在需要按自然順序或自定義順序遍歷鍵的情況下;
LinkedHashMap:在需要輸出的順序和輸入的順序相同的情況下。
Q:HashMap 和 HashTable 有什麼區別?
A:①、HashMap 是執行緒不安全的,HashTable 是執行緒安全的;
②、由於執行緒安全,所以 HashTable 的效率比不上 HashMap;
③、HashMap最多隻允許一條記錄的鍵為null,允許多條記錄的值為null,而 HashTable 不允許;
④、HashMap 預設初始化陣列的大小為16,HashTable 為 11,前者擴容時,擴大兩倍,後者擴大兩倍+1;
⑤、HashMap 需要重新計算 hash 值,而 HashTable 直接使用物件的 hashCode
Q:Java 中的另一個執行緒安全的與 HashMap 極其類似的類是什麼?同樣是執行緒安全,它與 HashTable 線上程同步上有什麼不同?
A:ConcurrentHashMap 類(是 Java併發包 java.util.concurrent 中提供的一個執行緒安全且高效的 HashMap 實現)。
HashTable 是使用 synchronize 關鍵字加鎖的原理(就是對物件加鎖);
而針對 ConcurrentHashMap,在 JDK 1.7 中採用 分段鎖的方式;JDK 1.8 中直接採用了CAS(無鎖演算法)+ synchronized。
另外,HashMap 的鍵值對允許有null,但是ConCurrentHashMap 都不允許。
Q:HashMap & ConcurrentHashMap 的區別?
A:除了加鎖,原理上無太大區別。
另外,HashMap 的鍵值對允許有null,但是ConCurrentHashMap 都不允許。
Q:為什麼 ConcurrentHashMap 比 HashTable 效率要高?
A:HashTable 使用一把鎖(鎖住整個連結串列結構)處理併發問題,多個執行緒競爭一把鎖,容易阻塞;
ConcurrentHashMap
JDK 1.7 中使用分段鎖(ReentrantLock + Segment + HashEntry),相當於把一個 HashMap 分成多個段,每段分配一把鎖,這樣支援多執行緒訪問。鎖粒度:基於 Segment,包含多個 HashEntry。
JDK 1.8 中使用 CAS + synchronized + Node + 紅黑樹。鎖粒度:Node(首結點)(實現 Map.Entry)。鎖粒度降低了。
Q:針對 ConcurrentHashMap 鎖機制具體分析(JDK 1.7 VS JDK 1.8)?
JDK 1.7 中,採用分段鎖的機制,實現併發的更新操作,底層採用陣列+連結串列的儲存結構,包括兩個核心靜態內部類 Segment 和 HashEntry。
①、Segment 繼承 ReentrantLock(重入鎖) 用來充當鎖的角色,每個 Segment 物件守護每個雜湊對映表的若干個桶;
②、HashEntry 用來封裝對映表的鍵-值對;
③、每個桶是由若干個 HashEntry 物件連結起來的連結串列。
JDK 1.8 中,採用Node + CAS + Synchronized來保證併發安全。取消類 Segment,直接用 table 陣列儲存鍵值對;當 HashEntry 物件組成的連結串列長度超過 TREEIFY_THRESHOLD 時,連結串列轉換為紅黑樹,提升效能。底層變更為陣列 + 連結串列 + 紅黑樹。
Q:ConcurrentHashMap 簡單介紹?
A:
①、重要的常量:
private transient volatile int sizeCtl;
當為負數時,-1 表示正在初始化,-N 表示 N - 1 個執行緒正在進行擴容;
當為 0 時,表示 table 還沒有初始化;
當為其他正數時,表示初始化或者下一次進行擴容的大小。
②、資料結構:
Node 是儲存結構的基本單元,繼承 HashMap 中的 Entry,用於儲存資料;
TreeNode 繼承 Node,但是資料結構換成了二叉樹結構,是紅黑樹的儲存結構,用於紅黑樹中儲存資料;
TreeBin 是封裝 TreeNode 的容器,提供轉換紅黑樹的一些條件和鎖的控制。
③、儲存物件時(put() 方法):
1.如果沒有初始化,就呼叫 initTable() 方法來進行初始化;
2.如果沒有 hash 衝突就直接 CAS 無鎖插入;
3.如果需要擴容,就先進行擴容;
4.如果存在 hash 衝突,就加鎖來保證執行緒安全,兩種情況:一種是連結串列形式就直接遍歷到尾端插入,一種是紅黑樹就按照紅黑樹結構插入;
5.如果該連結串列的數量大於閥值 8,就要先轉換成紅黑樹的結構,break 再一次進入迴圈
6.如果新增成功就呼叫 addCount() 方法統計 size,並且檢查是否需要擴容。
④、擴容方法 transfer():預設容量為 16,擴容時,容量變為原來的兩倍。
helpTransfer():呼叫多個工作執行緒一起幫助進行擴容,這樣的效率就會更高。
⑤、獲取物件時(get()方法):
1.計算 hash 值,定位到該 table 索引位置,如果是首結點符合就返回;
2.如果遇到擴容時,會呼叫標記正在擴容結點 ForwardingNode.find()方法,查詢該結點,匹配就返回;
3.以上都不符合的話,就往下遍歷結點,匹配就返回,否則最後就返回 null。
Q:ConcurrentHashMap 的併發度是什麼?
A:程式執行時能夠同時更新 ConccurentHashMap 且不產生鎖競爭的最大執行緒數。預設為 16,且可以在建構函式中設定。當用戶設定併發度時,ConcurrentHashMap 會使用大於等於該值的最小2冪指數作為實際併發度(假如使用者設定併發度為17,實際併發度則為32)