詳解Java中的HashTable

阿新 • • 發佈：2020-12-04

概論

HashTable是遺留類，很多對映的常用功能與HashMap類似，不同的是它承自Dictionary類，並且是執行緒安全的，併發性不如ConcurrentHashMap，因為ConcurrentHashMap引入了分段鎖。

Hashtable不建議在新程式碼中使用，不需要執行緒安全的場合可以用HashMap替換，需要執行緒安全的場合可以用ConcurrentHashMap替換。

對比HashMap 的初始容量

預設11 的初始容量
需要注意的是Hashtable的預設初始容量大小是11，而HashMap 是16,但是他們的載入因子都是0.75f

  /**
   * Constructs a new,empty hashtable with a default initial capacity (11)
   * and load factor (0.75).
   */
  public Hashtable() {
    this(11,0.75f);
  }

/**
 * Constructs an empty <tt>HashMap</tt> with the default initial capacity
 * (16) and the default load factor (0.75).
 */
public HashMap() {
  this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
}

任意指定非負的容量
還有一點就是Hashtable的initialCapacity 也就是初始容量是是可以是你指定的任何非負整數，也就是你給它設定個0 也可以的

public Hashtable(int initialCapacity) {
  this(initialCapacity,0.75f);
}

public Hashtable(int initialCapacity,float loadFactor) {
  if (initialCapacity < 0)
    throw new IllegalArgumentException("Illegal Capacity: "+
                      initialCapacity);
  if (loadFactor <= 0 || Float.isNaN(loadFactor))
    throw new IllegalArgumentException("Illegal Load: "+loadFactor);
    
  if (initialCapacity==0)
    initialCapacity = 1;
  this.loadFactor = loadFactor;
  table = new Entry<?,?>[initialCapacity];
  threshold = (int)Math.min(initialCapacity * loadFactor,MAX_ARRAY_SIZE + 1);
}

但是你看一下HashMap 的初始容量就不那麼聽話了，預設情況下，當我們設定HashMap的初始化容量時，實際上HashMap會採用第一個大於該數值的2的冪作為初始化容量(0 1 除外)

public HashMap(int initialCapacity,float loadFactor) {
  if (initialCapacity < 0)
    throw new IllegalArgumentException("Illegal initial capacity: " + initialCapacity);
  if (initialCapacity > MAXIMUM_CAPACITY)
    initialCapacity = MAXIMUM_CAPACITY;
  if (loadFactor <= 0 || Float.isNaN(loadFactor))
    throw new IllegalArgumentException("Illegal load factor: " + loadFactor);
  this.loadFactor = loadFactor;
  this.threshold = tableSizeFor(initialCapacity);
}

對比HashMap 的對null 值的支援

HashTable key value 都不支援null
首先HashMap 是支援null 值做key和value 的，但是HashTable 是不支援的，key 也不支援 value 也不支援

public synchronized V put(K key,V value) {
  // Make sure the value is not null
  if (value == null) {
    throw new NullPointerException();
  }

  // Makes sure the key is not already in the hashtable.
  Entry<?,?> tab[] = table;
  int hash = key.hashCode();
  int index = (hash & 0x7FFFFFFF) % tab.length;
  @SuppressWarnings("unchecked")
  Entry<K,V> entry = (Entry<K,V>)tab[index];
  for(; entry != null ; entry = entry.next) {
    if ((entry.hash == hash) && entry.key.equals(key)) {
      V old = entry.value;
      entry.value = value;
      return old;
    }
  }
  addEntry(hash,key,value,index);
  return null;
}

聰明的你們發現了嗎，上面值檢測了value ==null 則丟擲NPE 但是沒有說key 啊，因為如果key 是null 的話，key.hashCode()則會丟擲異常，根本不需要判斷，但是value 就不會丟擲來

但是需要注意的實HashMap 對null 值雖然支援，但是可以從hash值的計算方法中看出，<null,value>的鍵值對，value 會覆蓋的。

static final int hash(Object key) {
  int h;
  return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

升級HashTable 使其支援null 做value
大部分程式碼都是直接copy 的HashTable，只去掉了value 的空值檢測

public class BuerHashTable<K,V> extends Hashtable<K,V> {
		// ..... 省略了部分程式碼，直接copy HashTable 的即可，主要是BuerHashTable.Entry 的定義和構造方法
  public synchronized V put(K key,V value) {

    // Makes sure the key is not already in the hashtable.
    Entry<?,?> tab[] = table;
    int hash = key.hashCode();
    int index = (hash & 0x7FFFFFFF) % tab.length;
    @SuppressWarnings("unchecked")
    Entry<K,V>)tab[index];
    for(; entry != null ; entry = entry.next) {
      if ((entry.hash == hash) && entry.key.equals(key)) {
        V old = entry.value;
        entry.value = value;
        return old;
      }
    }

    addEntry(hash,index);
    return null;
  }
  private void addEntry(int hash,K key,V value,int index) {
    modCount++;

    BuerHashTable.Entry<?,?> tab[] = table;
    if (count >= threshold) {
      // Rehash the table if the threshold is exceeded
      rehash();

      tab = table;
      hash = key.hashCode();
      index = (hash & 0x7FFFFFFF) % tab.length;
    }

    // Creates the new entry.
    @SuppressWarnings("unchecked")
    BuerHashTable.Entry<K,V> e = (BuerHashTable.Entry<K,V>) tab[index];
    tab[index] = new BuerHashTable.Entry<>(hash,e);
    count++;
  }
}

接下來，就可以將null 值作為value 存入BuerHashTable 了

BuerHashTable<String,String> buerHashTable = new BuerHashTable<>();
buerHashTable.put("a",null);

對比 HashTable 的繼承關係

詳解Java中的HashTable

Dictionary

這個類是HashTable特有繼承的，HashMap 是沒有繼承的，但是這個抽象類其實是沒有多大意義的,因為它的方法都在Map介面中有，其實這個就是個歷史問題了，因為Map介面是在Java1.2 中才加進去的，而Dictionary抽象類在Java1.0中就存在了

public abstract
class Dictionary<K,V> {
  public Dictionary() {
  }
  abstract public int size();
  abstract public boolean isEmpty();
  abstract public Enumeration<K> keys();
  abstract public Enumeration<V> elements();
  abstract public V get(Object key);
  /**
   * @exception NullPointerException if the <code>key</code> or
   */
  abstract public V put(K key,V value);
  abstract public V remove(Object key);
}

這個地方的NullPointerException 對應的就是HashTable 中put 方法中的null 值檢測

最後一點就是Dictionary 抽象類上的註釋，新的實現應該實現Map 介面而不是該抽象類

NOTE: This class is obsolete. New implementations should implement the Map interface,rather than extending this class

其實HashMap更準確地說是繼承自AbstractMap類，而不是直接實現了Map 介面，所以要是Dictionary這個抽象類要是實現的實Map 介面，那HashMap和Hashtable 就在繼承關係上保持一致了

Hashtable

執行緒安全

其實HashTable 沒有那麼多要說的，比較重要的一點就是執行緒安全，但是這個執行緒安全的實現方式就是所有的操作都加了synchronized關鍵字，哈哈！關於synchronized 我們後面會說

public synchronized int size() {}
public synchronized boolean isEmpty() {}
public synchronized boolean contains(Object value) {}
public synchronized boolean containsKey(Object key) {}
public synchronized V get(Object key) {}
public synchronized V put(K key,V value) {}
public synchronized V remove(Object key) {}

而HashMap 是執行緒不安全的

contains方法
HashMap中沒有Hashtable中的contains方法，只有containsValue和containsKey，因為contains方法容易讓人引起誤解。

Hashtable則保留了contains，containsValue和containsKey三個方法，其中contains和containsValue功能相同。

debug 原始碼 put 方法

public synchronized V put(K key,V value) {
  // Make sure the value is not null 確保value 不是null
  if (value == null) {
    throw new NullPointerException();
  }

  // Makes sure the key is not already in the hashtable.
  // 這裡的英文註釋很有意思啊，就是告訴你確保key 不存在，存在咋地，覆蓋又咋地
  Entry<?,?> tab[] = table;
  // 雜湊值的計算不同，HashTable直接使用物件的hashCode。而HashMap重新計算hash值(高16位異或低16位)
  int hash = key.hashCode();
  // 計算下標 HashMap 是計算key的hash再與tab.length-1進行與運算；
  // HashTable則是key的hash值與0x7FFFFFFF進行與運算，然後再對tab.length取模
  // 先hash&0x7FFFFFFF後，再對length取模，與0x7FFFFFFF的目的是為了將負的hash值轉化為正值，因為hash值有可能為負數，而&0x7FFFFFFF後，只有符號外改變，而後面的位都不變
  int index = (hash & 0x7FFFFFFF) % tab.length;
  @SuppressWarnings("unchecked")
  // 確定 index 位置上的連結串列頭，這裡主要是遍歷連結串列找到key 值相等的節點，然後返回old value，這樣的話就不用新增新值
  // 也就是不用呼叫addEntry 方法
  Entry<K,V>)tab[index];
  // 存在key 
  for(; entry != null ; entry = entry.next) {
    if ((entry.hash == hash) && entry.key.equals(key)) {
      V old = entry.value;
      entry.value = value;
      return old;
    }
  }
  // 連結串列中不存在，則新增新值
  addEntry(hash,index);
  // 返回null 
  return null;
}

private void addEntry(int hash,int index) {
  modCount++;
  Entry<?,?> tab[] = table;
  // 判斷是否要擴容
  if (count >= threshold) {
    // Rehash the table if the threshold is exceeded
    rehash();
    tab = table;
    hash = key.hashCode();
    index = (hash & 0x7FFFFFFF) % tab.length;
  }
  // Creates the new entry.
  @SuppressWarnings("unchecked")
  Entry<K,V> e = (Entry<K,V>) tab[index];
  // e 也就是 tab[index] 是這個連結串列的頭結點， tab[index] = new Entry<>(hash,e); 也就是將元素新增到連結串列的頭部，e 做為new Entry<>(hash,e)的next 節點
  tab[index] = new Entry<>(hash,e);
  count++;
}

這裡我們對比一下HashMap 的新增方法,很明顯別人都是新增的連結串列尾部的，因為HashTable 是執行緒安全的，在這個前提下，使用頭查法效能更好，否則還有遍歷到連結串列的尾部插入

for (int binCount = 0; ; ++binCount) {
  if ((e = p.next) == null) {
    p.next = newNode(hash,null);
    if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
      treeifyBin(tab,hash);
    break;
  }
  if (e.hash == hash &&
    ((k = e.key) == key || (key != null && key.equals(k))))
    break;
  p = e;
}

最後我們再看一下擴容的方法

@SuppressWarnings("unchecked")
protected void rehash() {
  int oldCapacity = table.length;
  Entry<?,?>[] oldMap = table;

  // overflow-conscious code 
  // 擴容成2倍+1
  int newCapacity = (oldCapacity << 1) + 1;
  // 這裡判斷是否超出了容量限制
  if (newCapacity - MAX_ARRAY_SIZE > 0) {
    if (oldCapacity == MAX_ARRAY_SIZE)
      // Keep running with MAX_ARRAY_SIZE buckets
      return;
    // 最大容量 MAX_ARRAY_SIZE  
    newCapacity = MAX_ARRAY_SIZE;
  }
  // 建立新的陣列
  Entry<?,?>[] newMap = new Entry<?,?>[newCapacity];
  modCount++;
  // 更新 threshold
  threshold = (int)Math.min(newCapacity * loadFactor,MAX_ARRAY_SIZE + 1);
  table = newMap;
  // 資料遷移，遍歷陣列
  for (int i = oldCapacity ; i-- > 0 ;) {
  		// for 迴圈的方式遍歷連結串列
    for (Entry<K,V> old = (Entry<K,V>)oldMap[i] ; old != null ; ) {
      Entry<K,V> e = old;
      old = old.next;
      int index = (e.hash & 0x7FFFFFFF) % newCapacity;
      e.next = (Entry<K,V>)newMap[index];
      newMap[index] = e;
    }
  }
}

總結

需要注意的是Hashtable的預設初始容量大小是11，而HashMap 是16,但是他們的載入因子都是0.75f
HashTable的初始容量可以使任何非負整數，但是HashMap會採用第一個大於該數值的2的冪作為初始化容量(0 1 除外，都是 1)
HashTable的執行緒安全是完全藉助synchronized 的加持
HashTable 的元素是頭插法，也就是插入到連結串列的頭部，因為HashTable 是執行緒安全的，在這個前提下，使用頭查法效能更好，否則還有遍歷到連結串列的尾部插入
HashTable 是沒有紅黑樹支援的，就是不論連結串列的長度有多長，都不會轉化成紅黑樹
雜湊值的計算不同，HashTable直接使用物件的hashCode。而HashMap重新計算hash值(高16位異或低16位)，並且HashMap 支援key 為null 就是在這裡的
Hashtable擴容時，將容量變為原來的2倍加1，而HashMap擴容時，將容量變為原來的2倍。

你覺得HashTable 還有什麼可以改進的地方嗎，歡迎討論
和上一節一樣這裡我依然給出這個思考題，雖然我們的說法可能不對，可能我們永遠也站不到原始碼作者當年的高度，但是我們依然積極思考，大膽討論

雖然java 原始碼的山很高，如果你想跨越，至少你得有登山的勇氣，這裡我給出自己的一點點愚見，希望各位不吝指教

int hash = key.hashCode();
addEntry(hash,index);
private void addEntry(int hash,int index) {
		// 記錄修改，快速失敗
  modCount++;
  Entry<?,?> tab[] = table;
  // count 實際儲存的key-value 數目，在HashMap 中用size 表示
  if (count >= threshold) {
    // Rehash the table if the threshold is exceeded
    rehash();
    tab = table;
    // 咋地，陣列擴容之後key 的hash值會變嗎，你還有重新計算一下
    hash = key.hashCode();
    index = (hash & 0x7FFFFFFF) % tab.length;
  }
  // Creates the new entry.
  @SuppressWarnings("unchecked")
  Entry<K,V>) tab[index];
  tab[index] = new Entry<>(hash,e);
  count++;
}

當然這只是小問題，但是也有很多其他小問題，例如求index 時候的計算方式是直接取模，而不是用與運算，它最大的問題在設計上，例如hash值的計算方式就沒有HashMap 設計的好，還有就是沒有紅黑樹的支援，還有就是執行緒安全的實現方式也不高效，所以我們說它好像是遺留類,HashTable 在Java1.0 時代就存在了，而HashMap才是Java1.2才有的。

以上就是詳解Java中的HashTable的詳細內容，更多關於Java HashTable的資料請關注我們其它相關文章！

詳解Java中的HashTable

詳解Java中的HashTable

詳解Java中Math.round()的取整規則

詳解JAVA中static的作用

詳解java中的阻塞佇列

詳解java中的static關鍵字

詳解Java中NullPointerException異常的原因詳解以及解決方法

詳解Java中的字串

詳解Java中native方法的使用

詳解Java中的BigDecimal

詳解Java中的日期類

詳解java中DelayQueue的使用

詳解Java中方法next()和nextLine()的區別與易錯點

詳解Java 中的 AutoCloseable 介面

詳解java中if語句和switch的使用

詳解Java中String JSONObject JSONArray List<實體類>轉換

詳解Java中的pinpoint1.8.5安裝及使用指南

詳解Java中的延時佇列 DelayQueue

詳解java中static關鍵詞的作用

詳解Java中的ReentrantLock鎖

詳解JAVA中priorityqueue的具體使用

詳解Java中的HashTable

相關推薦