HashSet底層存儲元素的源碼分析
阿新 • • 發佈:2018-05-25
false res pin 支持 哈希表 nod 一個 tin IE
此類實現 Set 接口,由哈希表(實際上是一個 HashMap 實例)支持。它不保證 set 的叠代順序;特別是它不保證該順序恒久不變。此類允許使用 null 元素。
HashSet<String> set = new HashSet<String>();
set.add("abc");
1 private transient HashMap<E,Object> map; 2 /** 7 * Constructs a new, empty set; the backing <tt>HashMap</tt> instance has8 * default initial capacity (16) and load factor (0.75). 9 */ 10 public HashSet() { 11 map = new HashMap<>(); 12 }
點擊
HashSet
進入 看Hash源碼,證明 它確實是 由一個 HashMap 實例支持。
眾所周知,set是無序,不重復的。那麽它是如何保證元素唯一性的呢?
先看源碼。點擊 add方法進入。
public boolean add(E e) { return map.put(e, PRESENT)==null; }
public V put(K key, V value) { return putVal(hash(key), key, value, false, true); }
1 final V putVal(int hash, K key, V value, boolean onlyIfAbsent, 2 boolean evict) { 3 Node<K,V>[] tab; Node<K,V> p; int n, i; 4 if ((tab = table) == null|| (n = tab.length) == 0) 5 n = (tab = resize()).length; 6 if ((p = tab[i = (n - 1) & hash]) == null) 7 tab[i] = newNode(hash, key, value, null); 8 else { 9 Node<K,V> e; K k; 10 if (p.hash == hash && 11 ((k = p.key) == key || (key != null && key.equals(k)))) 12 e = p; 13 else if (p instanceof TreeNode) 14 e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value); 15 else { 16 for (int binCount = 0; ; ++binCount) { 17 if ((e = p.next) == null) { 18 p.next = newNode(hash, key, value, null); 19 if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st 20 treeifyBin(tab, hash); 21 break; 22 } 23 if (e.hash == hash && 24 ((k = e.key) == key || (key != null && key.equals(k)))) 25 break; 26 p = e; 27 } 28 } 29 if (e != null) { // existing mapping for key 30 V oldValue = e.value; 31 if (!onlyIfAbsent || oldValue == null) 32 e.value = value; 33 afterNodeAccess(e); 34 return oldValue; 35 } 36 } 37 ++modCount; 38 if (++size > threshold) 39 resize(); 40 afterNodeInsertion(evict); 41 return null; 42 }
1 static final int hash(Object key) { 2 int h; 3 return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16); 4 }
通過以上源碼,可以發現為保證唯一性。
1.將傳入的元素進行hashCode方法調用,得到該元素的hash值。拿到hash值還需要和數組的長度進行運算,獲取元素存儲的下標值。
獲取元素存儲的下標值,嘗試將傳入的元素存儲到對應的下標中。
2.如果計算出來的下標中,不存在元素,則直接存儲。否則執行第3步的equals方法。
3.如果存儲對象的equals方法返回true,說明是一樣的,所以不存。如果返回false,說明不一樣,要存儲起來。
4.使用“單鏈表”將存儲數據鏈接起來。
那麽單鏈表是什麽樣子的代碼呢?
Node<K,V> next; 這就是單鏈表的數據結構
1 static class Node<K,V> implements Map.Entry<K,V> { 2 final int hash; 3 final K key; 4 V value; 5 Node<K,V> next; 6 7 Node(int hash, K key, V value, Node<K,V> next) { 8 this.hash = hash; 9 this.key = key; 10 this.value = value; 11 this.next = next; 12 } 13 14 public final K getKey() { return key; } 15 public final V getValue() { return value; } 16 public final String toString() { return key + "=" + value; } 17 18 public final int hashCode() { 19 return Objects.hashCode(key) ^ Objects.hashCode(value); 20 } 21 22 public final V setValue(V newValue) { 23 V oldValue = value; 24 value = newValue; 25 return oldValue; 26 } 27 28 public final boolean equals(Object o) { 29 if (o == this) 30 return true; 31 if (o instanceof Map.Entry) { 32 Map.Entry<?,?> e = (Map.Entry<?,?>)o; 33 if (Objects.equals(key, e.getKey()) && 34 Objects.equals(value, e.getValue())) 35 return true; 36 } 37 return false; 38 } 39 }
這個就是hashSet的存儲圖。其中紅色的線就是鏈表線。
這個單鏈表具體長這樣的:
最後結論:HashSet底層依賴HashMap來實現。使用Node數組與單鏈表來實現元素的存儲。
HashSet底層存儲元素的源碼分析