【資料結構】9.java原始碼關於HashTable
1.hashtable的內部結構
基礎儲存資料的hash桶由Entry結構的陣列存放
而entry資料結構,有hash,key和value,還有一個指向下一個節點的引用next物件
這裡就和hashmap中的資料結構不一樣了,hashmap中的資料結構是node,雖然結構上差不多,但是setvalue的非空判斷和hashcode的雜湊取值都是和node不一樣的
那麼這些資料在什麼時候用呢???
下面來一一瞭解
2.hashtable的建構函式
這裡需要注意一下了,我們前面提到說hashmap中的建構函式,其實實際上是不對hash桶進行例項化的,但是hashtable不一樣,他會直接例項化大小,並且例項化成你指定的大小
而且這裡預設的初始化容器的大小是11,負載因子代銷預設0.75,負載因子的作用就是規定最大容量:hash桶的大小*負載因子
public TestHashTable(int initialCapacity, float loadFactor) { //非空判斷 if (initialCapacity < 0) throw new IllegalArgumentException("Illegal Capacity: " + initialCapacity); if (loadFactor <= 0 || Float.isNaN(loadFactor)) throw new IllegalArgumentException("Illegal Load: " + loadFactor); //至少設定為1 if (initialCapacity==0) initialCapacity = 1; this.loadFactor = loadFactor; table = new Entry<?,?>[initialCapacity]; threshold = (int)Math.min(initialCapacity * loadFactor, MAX_ARRAY_SIZE + 1); }
3.hashtable的增加元素策略
1.這裡的put方法加了synchronized修飾符,用來標識執行緒安全
2.這裡進行put取索引位置的時候,是直接用的key的hashcode方法,並且對hashcode結果進行取正數(& 0x7FFFFFFF),然後對hash桶進行取餘%
然後就是判斷這個key是否存在於這個hash桶中,如果存在更新舊值,並返回舊值
不存在,那麼就新增一個entry,所以put操作的關鍵就是addEntry
而我們add操作其實就是找到對應的雜湊位置,然後用頭插法
private void addEntry(int hash, K key, V value, int index) { modCount++; Entry<?,?> tab[] = table; if (count >= threshold) { // Rehash the table if the threshold is exceeded rehash(); tab = table; hash = key.hashCode(); index = (hash & 0x7FFFFFFF) % tab.length; } // Creates the new entry. @SuppressWarnings("unchecked") Entry<K,V> e = (Entry<K,V>) tab[index]; //頭插法 tab[index] = new Entry<>(hash, key, value, e); count++; }
說實話,這裡相比hashmap來說簡單多了,主要是少了樹化的操作
4.hashtable刪除元素策略
刪除就比較簡單了,就是找到對應的索引位置,然後再查詢連結串列,如果是頭節點,直接把entry.next設定為索引位置的資料,如果不是,就要獲取到pre節點,然後pre.next = entry.next
public synchronized V remove(Object key) { Entry<?,?> tab[] = table; int hash = key.hashCode(); int index = (hash & 0x7FFFFFFF) % tab.length; @SuppressWarnings("unchecked") Entry<K,V> e = (Entry<K,V>)tab[index]; for(Entry<K,V> prev = null ; e != null ; prev = e, e = e.next) { if ((e.hash == hash) && e.key.equals(key)) { modCount++; if (prev != null) { prev.next = e.next; } else { tab[index] = e.next; } count--; V oldValue = e.value; e.value = null; return oldValue; } } return null; }
主要是for迴圈這個地方有點意思,其餘的到還好,無非就是返回舊值而已
5.修改元素,查詢元素
修改不多做操作了,和新增,刪除操作差不多,只是沒有裡面的多餘操作,就是找到元素就直接返回了
6.hashtable特殊操作
1.hashtable是允許放空鍵值的,也就是鍵和值都可以放null
2.還有hashtable是執行緒安全的
3.hashmap再1.8之後是陣列+連結串列+紅黑樹,hashtable還是很光棍-》陣列+連結串列
4.擴容需要說一下,hashmap會擴容到比設定值大的最小2次冪,hashtable就群魔亂舞隨意了
5.hashmap和hashtable都是取餘,但是有點不同,因為hashmap是2次冪,所以取餘的方式不一樣是:(n - 1) & hash,為什麼這樣,請複習hashmap原始碼分析。。。
7.hashtable的重新整理擴容
protected void rehash() { int oldCapacity = table.length; Entry<?,?>[] oldMap = table; //直接左移一位,也就是擴大2倍然後+1 =》 大小擴為 2n + 1 int newCapacity = (oldCapacity << 1) + 1; if (newCapacity - MAX_ARRAY_SIZE > 0) { //Integer.MAX_VALUE - 8 if (oldCapacity == MAX_ARRAY_SIZE) //如果老的容量已經達到這個值,anemia繼續保持 // Keep running with MAX_ARRAY_SIZE buckets return; newCapacity = MAX_ARRAY_SIZE; //否則設定為允許的最大值 } //建立新的hash桶 Entry<?,?>[] newMap = new Entry<?,?>[newCapacity]; modCount++; //設定新的閾值 threshold = (int)Math.min(newCapacity * loadFactor, MAX_ARRAY_SIZE + 1); table = newMap; //遍歷hash桶,從後往前 for (int i = oldCapacity ; i-- > 0 ;) { //遍歷所有索引下的連結串列,吧連結串列新增到新的hash桶上 for (Entry<K,V> old = (Entry<K,V>)oldMap[i] ; old != null ; ) { Entry<K,V> e = old; old = old.next; //先取正,然後取餘 int index = (e.hash & 0x7FFFFFFF) % newCapacity; e.next = (Entry<K,V>)newMap[index]; newMap[index] = e; } } }
總結一下吧:
說實話,看完hashtable沒花多久時間,相比較hashmap給人的驚為天人的操作,hashtable相對來說就比較樸實無華了,唯一的幾個亮點就是執行緒安全,然後。。。。
想不出來了,只能說存在即合理,不能說hashtable會比較low,也許是我眼拙,大道至簡,也許沒有那些花裡胡哨的才是真正最實用的
參考:
https://juejin.im/post/5a03b258518825188e515d89
https://blog.csdn.net/yyc1023/article/details/80619623
&n