1. 程式人生 > >(二)Java集合專題-詳細分析HashtableJDK1.8集合底層實現的思想

(二)Java集合專題-詳細分析HashtableJDK1.8集合底層實現的思想

(一)詳細分析Hashtable1.8集合底層實現的思路和原始碼

(1)先來看一下Hashtable的結構圖:首先他和HashMap結構都是一樣的,都是由陣列和連結串列進行實現的(在JDK1.8是用陣列和連結串列和紅黑樹的),每一個數組裡面存的是一個Entry節點,節點裡面有Key、Value,唯一最大 的區別就是HashMap實現不是執行緒安全的,但是Hashtable是執行緒安全的,但是Hashtable在多執行緒下的效率不是很好,比起ConcurrentHashMap的效率比起來還是有點低的。所以不建議使用,這裡只做瞭解就行了
在這裡插入圖片描述
Hashtable繼承的是Dictionary,實現的是Map的介面、Cloneable、和Serializable 的序列化介面

  • public class Hashtable<K,V>
    extends Dictionary<K,V>
    implements Map<K,V>, Cloneable, java.io.Serializable {

(2)他的主要方法都是通過Synchronize來實現的:

public synchronized int size(){}
public synchronized boolean isEmpty() {}
public synchronized Enumeration<K> keys() {}
public synchronized Enumeration<V> elements() {}
public synchronized boolean contains(Object value) {}
public synchronized boolean containsKey(Object key) {}
public synchronized V get(Object key) {}
public synchronized V put(K key, V value) {}
public synchronized V remove(Object key) {}
public synchronized void putAll(Map<? extends K, ? extends V> t) {}
public synchronized void clear() {}
public synchronized Object clone() {}
public synchronized String toString() {}
public synchronized boolean equals(Object o) {}
public synchronized int hashCode() {}

(3)看一下幾個主要的原始碼的實現和初始化的原始碼:

    1. Hashtable的一些變數引數:
public class Hashtable<K,V> extends Dictionary<K,V> implements 
                    Map<K,V>, Cloneable, java.io.Serializable {
    
    // 儲存元素的table,Entry節點採用內部類實現
    private transient Entry[] table;

    // 已存放元素的計數器
    private transient int count;
    
    // 擴容閾值=table長度 * loadFactor
    // table表的元素(不包含連結串列中的元素)超過這個閾值將擴容
    private int threshold;
    
    // 負載因子
    private float loadFactor;
    
    // 其他省略
}

    1. Hashtable的初始化:在預設構造方法中,呼叫了Hashtable(int initialCapacity, float loadFactor)方法,初始Hashtable的容量為11,負載因子為0.75,那麼初始閾值就是8。這點和HashMap很不同,HashMap在初始化時,table的大小總是2的冪次方,即使給定一個不是2的冪次方容量的值,也會自動初始化為最接近其2的冪次方的容量
    public Hashtable(int initialCapacity, float loadFactor) {
        if (initialCapacity < 0)
            throw new IllegalArgumentException("Illegal Capacity: "+
                                               initialCapacity);
        if (loadFactor <= 0 || Float.isNaN(loadFactor))
            throw new IllegalArgumentException("Illegal Load: "+loadFactor);

        if (initialCapacity==0)
            initialCapacity = 1;
        this.loadFactor = loadFactor;
        table = new Entry<?,?>[initialCapacity];
        threshold = (int)Math.min(initialCapacity * loadFactor, MAX_ARRAY_SIZE + 1);
    }
    1. 內部類Entry節點:Entry節點中儲存了元素的hash值,next是指連結串列的下一個節點
private static class Entry<K,V> implements Map.Entry<K,V> {
    int hash;
    K key;
    V value;
    Entry<K,V> next;// 連結的下一個節點,構成連結串列
}
    1. get()方法的原始碼實現:
    public synchronized V get(Object key) {
        Entry<?,?> tab[] = table;
        int hash = key.hashCode();
        int index = (hash & 0x7FFFFFFF) % tab.length;
        for (Entry<?,?> e = tab[index] ; e != null ; e = e.next) {
            if ((e.hash == hash) && e.key.equals(key)) {
                return (V)e.value;
            }
        }
        return null;
    }

  1. 第一步先對Hashtable的key進行拿到hashcode,
  2. 然後用key的hashcode值進行疑惑,然後對陣列的長度進行取餘,這裡效率沒有HashMap的效率高
  3. 然後再去判斷當前的這個Entry節點有沒有存在資料值,3.1 如果存在,就去判斷這個Entry節點的key是不是和等於你要取的值對應的按個key,若果是直接返回
  4. 如果剛剛的那個3.1哪一步判斷不存在,就說明沒有你要的值,就直接返回NULL
  • 然後是Hashtable的put方法的實現:
    public synchronized V put(K key, V value) {
        // Make sure the value is not null
        if (value == null) {
            throw new NullPointerException();
        }

        // Makes sure the key is not already in the hashtable.
        Entry<?,?> tab[] = table;
        int hash = key.hashCode();
        int index = (hash & 0x7FFFFFFF) % tab.length;
        @SuppressWarnings("unchecked")
        Entry<K,V> entry = (Entry<K,V>)tab[index];
        for(; entry != null ; entry = entry.next) {
            if ((entry.hash == hash) && entry.key.equals(key)) {
                V old = entry.value;
                entry.value = value;
                return old;
            }
        }

        addEntry(hash, key, value, index);
        return null;
    }

這個是Put方法中的addEntry()方法

    private void addEntry(int hash, K key, V value, int index) {
        modCount++;

        Entry<?,?> tab[] = table;
        if (count >= threshold) {
            // Rehash the table if the threshold is exceeded
            rehash();

            tab = table;
            hash = key.hashCode();
            index = (hash & 0x7FFFFFFF) % tab.length;
        }

        // Creates the new entry.
        @SuppressWarnings("unchecked")
        Entry<K,V> e = (Entry<K,V>) tab[index];
        tab[index] = new Entry<>(hash, key, value, e);
        count++;
    }

這個是addEntry()方法中的rehash()方法

    protected void rehash() {
        int oldCapacity = table.length;
        Entry<?,?>[] oldMap = table;

        // overflow-conscious code
        int newCapacity = (oldCapacity << 1) + 1;
        if (newCapacity - MAX_ARRAY_SIZE > 0) {
            if (oldCapacity == MAX_ARRAY_SIZE)
                // Keep running with MAX_ARRAY_SIZE buckets
                return;
            newCapacity = MAX_ARRAY_SIZE;
        }
        Entry<?,?>[] newMap = new Entry<?,?>[newCapacity];

        modCount++;
        threshold = (int)Math.min(newCapacity * loadFactor, MAX_ARRAY_SIZE + 1);
        table = newMap;

        for (int i = oldCapacity ; i-- > 0 ;) {
            for (Entry<K,V> old = (Entry<K,V>)oldMap[i] ; old != null ; ) {
                Entry<K,V> e = old;
                old = old.next;

                int index = (e.hash & 0x7FFFFFFF) % newCapacity;
                e.next = (Entry<K,V>)newMap[index];
                newMap[index] = e;
            }
        }
    }

這裡重點說一下Hashtable中的put()方法的思路;

1、禁止null value插入。
2、根據key的hashCode值 與 0x7FFFFFFF求與後得到新的hash值,然後計算其在table中的索引下標。
3、在索引下標下遍歷連結串列,查詢key是否已存在,存在則更新value值。
4、如果不存在,判斷table.count是否超過閾值,超過則重新rehash,將原元素全部拷貝到新的table中,並重新計算索引下標。rehash後,容量是以前的2倍+1的大小,這點也和HashMap不同,HashMap是2倍。
5、插入元素時直接插入在連結串列頭部。
6、更新元素計數器。

最後終結一下HashMap和Hashtable的不同之處?

  1. 首先第一點是HashMap不是執行緒安全的,但是Hashtable是執行緒安全的
  2. HashMap的key和value都可以為NULL,但是Hashtable的key和value都不能為NULL,否則直接報錯。
  3. 在HashMap中的put()方法中,在定位桶陣列的下標的時候,使用的是key的hashcode &(n - 1) 跟通陣列的長度進行與的位運算,但是在Hashtable中的時候,用到的是(hash & 0x7FFFFFFF) % tab.length;這是對桶陣列的長度進行取模,效率肯定沒有上一步的hashmap的效率高
  4. HashMap的初始化預設桶陣列的長度是16負載因子0.75,但是在Hashtable中的通陣列的預設長度是11負載因子是0.75,在進行擴容的時候也會有點不一樣,在Hashtable中的擴容時用的是(oldCapacity << 1) + 1(也就是把原來的桶陣列長度左移一位二進位制,也就是長度*2+1)來進行的,而在HashMap中是直接二倍進行擴容的。
  5. 另一個區別是HashMap的迭代器(Iterator)是fail-fast迭代器,而Hashtable的enumerator迭代器不是fail-fast的。所以當有其它執行緒改變了HashMap的結構(增加或者移除元素),將會丟擲ConcurrentModificationException,但迭代器本身的remove()方法移除元素則不會丟擲ConcurrentModificationException異常。但這並不是一個一定發生的行為,要看JVM。這條同樣也是Enumeration和Iterator的區別。