JDK原始碼學習筆記——HashMap
阿新 • • 發佈:2019-12-31
JDK版本:13
參考
建議大家直接看這篇,寫的太好了~
1 類圖
HashMap
- 實現
java.util.Map
介面,繼承java.util.AbstractMap
抽像類。 - 實現
java.io.Serializable
介面。 - 實現
java.lang.Cloneable
介面。
順便看看Map的4個常用實現類
-
HashMap
:今天的主角 -
Hashtable
:執行緒安全,但效能不如ConcurrentHashMap
,沒必要繼續使用了 -
LinkedHashMap
:HashMap
的子類,儲存了元素插入的順序。 -
TreeMap
:能夠根據key排序。key必須實現Comparable
介面或構造TreeMap
時傳入自定義比較器。
2 概覽
HashMap底層是依靠陣列+連結串列(jdk1.8後引入了紅黑樹)實現的。查詢操作如何實現O(1)的時間複雜度是我們最關心的問題。 來看它的幾個主要屬性:
-
Node<K,V>[] table
雜湊桶陣列 -
int threshold
擴容閾值 -
float loadFactor
負載因子 -
int size
儲存的鍵值對的數量
簡單來講,HashMap內部維護了一個Node陣列table
,陣列上的每一個位置叫做一個雜湊桶。那麼如何利用陣列的特性來儲存鍵值對?
對key求hash值就可以把key轉為一個整數,以此作為下標就可以存在陣列裡了。但還不夠,陣列長度不夠用怎麼辦?
那就把hash(key)
對陣列長度取模,用hash(key) % (table.length -1)
作為下標就好了。還是不夠,不同的key計算出來的值一樣怎麼辦?
這也就是雜湊衝突了。HashMap採用了連結串列法處理。每一個雜湊桶都對應一個連結串列,如果發生雜湊衝突就把新的value放在連結串列末尾。這樣如果一個連結串列過長,還是會影響效能。從java8開始做了優化,當連結串列太長時,就轉為紅黑樹。
而擴容也是查詢操作保持O(1)時間複雜度的重要手段,我們希望儘量每個桶裡都只放了一個元素。threshold
size
超過threshold
時,HashMap會進行擴容。擴容閾值通過threshold = table.length * loadFactor
計算得到。擴容操作是非常消耗效能的,在初始化HashMap時,最好估算大小,用 HashMap(int initialCapacity)
方法構造,避免頻繁進行擴容。
loadFactor
是對空間和時間的一種平衡選擇。資料量相同的情況下,loadFactor
越小,HashMap佔用的空間越大,但越不容易雜湊衝突,查詢效率越高。相反,loadFactor
越大,佔用空間越小,查詢效率越低。loadFactor
預設值0.75,除非在特殊情況下,不建議修改。
table
的長度總是2的n次方。這樣hash(key) % (table.length -1)
可以寫為hash(key) & (table.length -1)
,位運算要有更高的效率。
3 構造方法
3.1 預設構造方法 HashMap()
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
static final float DEFAULT_LOAD_FACTOR = 0.75f;
public HashMap() {
// 使用預設負載因子建立一個空的HashMap (table會在第一次使用時初始化,預設初始容量為16)
this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
}
複製程式碼
3.2 給定容量的構造方法 HashMap(int initialCapacity)
public HashMap(int initialCapacity) {
// 建立一個指定容量(會計算得到2的冪)、預設負載因子的HashMap
this(initialCapacity,DEFAULT_LOAD_FACTOR);
}
複製程式碼
3.3 給定容量和負載因子的構造方法 HashMap(int initialCapacity,float loadFactor)
public HashMap(int initialCapacity,float loadFactor) {
// 校驗
if (initialCapacity < 0)
throw new IllegalArgumentException("Illegal initial capacity: " +
initialCapacity);
// 給定容量超過最大容量,則使用最大容量
if (initialCapacity > MAXIMUM_CAPACITY)
initialCapacity = MAXIMUM_CAPACITY;
// 校驗
if (loadFactor <= 0 || Float.isNaN(loadFactor))
throw new IllegalArgumentException("Illegal load factor: " +
// 設定負載因子 loadFactor);
this.loadFactor = loadFactor;
// 計算擴容閾值
this.threshold = tableSizeFor(initialCapacity); // 注意這個方法
}
/**
* 容量必須是2的冪,通過此方法計算得到大於給定容量的最小的2的冪
*/
static final int tableSizeFor(int cap) {
// 從二進位制cap的最左邊的1開始,全部設定為 1 ,得到 n ,這樣 n + 1就是要求的值
int n = -1 >>> Integer.numberOfLeadingZeros(cap - 1); // cap - 1 再計算避免cap假設剛好是8,但 n=16 這是不對的。
// cap 是 0 或 1 的時候 n 是 -1,此時返回 1
return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
}
複製程式碼
3.4 HashMap(Map<? extends K,? extends V> m)
public HashMap(Map<? extends K,? extends V> m) {
// 設定負載因子
this.loadFactor = DEFAULT_LOAD_FACTOR;
putMapEntries(m,false);
}
final void putMapEntries(Map<? extends K,? extends V> m,boolean evict) {
int s = m.size();
if (s > 0) {
// table 為空,還未初始化
if (table == null) { // pre-size
// 由map大小和負載因子計算table大小
float ft = ((float)s / loadFactor) + 1.0F; // 因為下邊(int)向下取整
int t = ((ft < (float)MAXIMUM_CAPACITY) ?
(int)ft : MAXIMUM_CAPACITY);
// 新的容量大於擴容閾值,則計算新的擴容閾值
if (t > threshold)
threshold = tableSizeFor(t);
// 若不為空 擴容直到夠用或達到最大值
} else {
// Because of linked-list bucket constraints,we cannot
// expand all at once,but can reduce total resize
// effort by repeated doubling now vs later
while (s > threshold && table.length < MAXIMUM_CAPACITY)
resize();
}
// 遍歷,將元素挨個新增到HashMap中
for (Map.Entry<? extends K,? extends V> e : m.entrySet()) {
K key = e.getKey();
V value = e.getValue();
// 後邊再看
putVal(hash(key),key,value,false,evict);
}
}
}
複製程式碼
4 主要方法
4.1 新增單個元素 V put(K key,V value)
/**
* 連結串列轉為紅黑樹的臨界值
*/
static final int TREEIFY_THRESHOLD = 8;
/**
* 紅黑樹退化為連結串列的臨界值
*/
static final int UNTREEIFY_THRESHOLD = 6;
public V put(K key,V value) {
return putVal(hash(key),true);
}
final V putVal(int hash,K key,V value,boolean onlyIfAbsent,boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n,i;
// table 未初始化或容量為0 則擴容
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()/*擴容*/).length;
if ((p = tab[i = (n - 1) & hash]/*獲得對應位置的 Node 節點*/) == null)
// 如果是空,直接new 一個新的 node 放在這個位置
tab[i] = newNode(hash,null);
else {
// 如果不是空
Node<K,V> e; // 目標node,存放新加入元素的node
K k;
// 如果 hash 值相等且 key 也相等,那這個 node 就是要找的 node
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
// 如果 p 是樹節點
else if (p instanceof TreeNode)
// 直接新增到樹中
e = ((TreeNode<K,V>)p).putTreeVal(this,tab,hash,value);
else {
// 順序遍歷連結串列
for (int binCount = 0; ; ++binCount) {
// 目標節點 e 指向 p 的下一個節點,如果已經遍歷到連結串列尾部,說明 key 不在 HashMap 中
if ((e = p.next) == null) {
// 建立新節點
p.next = newNode(hash,null);
// 如果連結串列長度達到 TREEIFY_THRESHOLD 時,轉為樹
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab,hash);
break; // 跳出迴圈
}
// 如果 hash 和 key 都相等,說明找到了目標 node
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break; // 跳出迴圈
p = e; // p指向下一個節點
}
}
// 找到了 key 對應的節點
if (e != null) { // existing mapping for key
V oldValue = e.value;
// 如果允許修改節點,則修改
if (!onlyIfAbsent || oldValue == null)
e.value = value;
// 節點被訪問的回撥函式
afterNodeAccess(e);
// 返回舊值
return oldValue;
}
}
// 增加修改次數
++modCount;
// 如果超過擴容閾值,則進行擴容
if (++size > threshold)
resize();
// 新增節點後的回撥
afterNodeInsertion(evict);
return null;
}
複製程式碼
4.2 擴容 Node<K,V>[] resize()
final Node<K,V>[] resize() {
Node<K,V>[] oldTab = table;
int oldCap = (oldTab == null) ? 0 : oldTab.length; // 注意這裡
int oldThr = threshold;
int newCap,newThr = 0;
// oldCap > 0,table 非空
if (oldCap > 0) {
// 如果超過最大容量
if (oldCap >= MAXIMUM_CAPACITY) {
// 擴容閾值設為最大值,返回舊table,不允許再擴容
threshold = Integer.MAX_VALUE;
return oldTab;
}
// 舊容量大於預設初始化容量且擴容兩倍後小於最大容量,則擴容兩倍
else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
oldCap >= DEFAULT_INITIAL_CAPACITY)
newThr = oldThr << 1; // double threshold
}
// oldCap <= 0,table 為空,所以下邊是初始化的情況
// oldThr > 0,非預設建構函式的情況
// 直接用oldThr 當做新的容量。oldThr由tableSizeFor()方法得出,一定是2的冪
else if (oldThr > 0) // initial capacity was placed in threshold
newCap = oldThr;
// 預設建構函式的情況
else { // zero initial threshold signifies using defaults
newCap = DEFAULT_INITIAL_CAPACITY;
newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
}
// 如果上邊沒有給出新的擴容閾值,則用 newCap * loadFactor 計算
if (newThr == 0) {
float ft = (float)newCap * loadFactor;
newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
(int)ft : Integer.MAX_VALUE);
}
// 新 擴容閾值 賦值
threshold = newThr;
@SuppressWarnings({"rawtypes","unchecked"})
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
// 用新的容量建立新的 table 並賦值
table = newTab;
// 如果舊 table 不是空,需要搬運資料
if (oldTab != null) {
for (int j = 0; j < oldCap; ++j) {
// j 位置的節點
Node<K,V> e;
// 如果節點不為空
if ((e = oldTab[j]) != null) {
// 置空舊table
oldTab[j] = null;
// 如果只有一個元素,直接賦值
if (e.next == null)
newTab[e.hash & (newCap - 1)] = e;
// 如果是樹節點
else if (e instanceof TreeNode)
// 處理。。。
((TreeNode<K,V>)e).split(this,newTab,j,oldCap);
// 如果是連結串列
else { // preserve order
Node<K,V> loHead = null,loTail = null;
Node<K,V> hiHead = null,hiTail = null;
Node<K,V> next;
do {
next = e.next;
// 擴容一倍後,原來位置的連結串列節點,要被分配到新 table 的兩個位置上去
// 如果去高位
if ((e.hash & oldCap) == 0) {
if (loTail == null)
loHead = e;
else
loTail.next = e;
loTail = e;
}
// 如果去低位
else {
if (hiTail == null)
hiHead = e;
else
hiTail.next = e;
hiTail = e;
}
} while ((e = next) != null);
// 低位放在新 table j 位置
if (loTail != null) {
loTail.next = null;
newTab[j] = loHead;
}
// 高位放在新 table j + oldCap 位置
if (hiTail != null) {
hiTail.next = null;
newTab[j + oldCap] = hiHead;
}
}
}
}
}
return newTab;
}
複製程式碼
4.3 移除單個元素 V remove(Object key)
public V remove(Object key) {
Node<K,V> e;
return (e = removeNode(hash(key),null,true)) == null ?
null : e.value;
}
final Node<K,V> removeNode(int hash,Object key,Object value,boolean matchValue,boolean movable) {
Node<K,V> p;
int n,index;
// table非空校驗,拿到 hash 對應位置的 p 節點,並且 p 節點不為null
if ((tab = table) != null && (n = tab.length) > 0 &&
(p = tab[index = (n - 1) & hash]) != null) {
Node<K,V> node = null,e; K k; V v; // 目標節點
// 通過 hash 和 equals 判斷 p 節點 就是 目標節點
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
node = p;
// 如果不是
else if ((e = p.next) != null) {
// 如果是樹
if (p instanceof TreeNode)
node = ((TreeNode<K,V>)p).getTreeNode(hash,key);
// 連結串列
else {
// 遍歷查詢目標節點
do {
if (e.hash == hash &&
((k = e.key) == key ||
(key != null && key.equals(k)))) {
node = e;
break;
}
p = e;
} while ((e = e.next) != null);
}
}
// 如果找到了目標節點
// 是否要校驗 value 相等,如果 matchValue 為 true 則進行校驗
if (node != null && (!matchValue || (v = node.value) == value ||
(value != null && value.equals(v)))) {
// 如果是樹 則在樹中刪除
if (node instanceof TreeNode)
((TreeNode<K,V>)node).removeTreeNode(this,movable);
// 如果node 就是 p , 也就是連結串列的頭結點,則將下一個節點放在 table 該位置中,實現移除
else if (node == p)
tab[index] = node.next;
// 如果不是頭結點,把 p 的 next 指向 node 的 next,實現移除
else
p.next = node.next;
// 增加修改次數
++modCount;
// size - 1
--size;
// 移除node的回撥
afterNodeRemoval(node);
// 返回被移除的node
return node;
}
}
// 沒找到 就返回null
return null;
}
複製程式碼
4.4 查詢單個元素 V get(Object key)
public V get(Object key) {
Node<K,V> e;
return (e = getNode(hash(key),key)) == null ? null : e.value;
}
final Node<K,V> getNode(int hash,Object key) {
Node<K,V> first,e; int n; K k;
// 拿到 table 中對應位置的節點 p
if ((tab = table) != null && (n = tab.length) > 0 &&
(first = tab[(n - 1) & hash]) != null) {
// 如果該位置頭結點就是要找的,直接返回
if (first.hash == hash && // always check first node
((k = first.key) == key || (key != null && key.equals(k))))
return first;
// 如果後邊還有
if ((e = first.next) != null) {
// 如果是樹 去樹裡找
if (first instanceof TreeNode)
return ((TreeNode<K,V>)first).getTreeNode(hash,key);
// 如果是連結串列 遍歷查詢
do {
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
return e;
} while ((e = e.next) != null);
}
}
return null;
}
複製程式碼