HashSet、LinkedHashSet、TreeSet的內部實現簡介

阿新 • • 發佈：2019-01-22

在寫這篇部落格之前，本人已經介紹了HashMap（HashMap內部儲存實現及HashTable比較）、LinkedHashMap（LinkedHashMap內部實現）、TreeMap（TreeMap內部實現簡介）。考慮到即將介紹的三種Set型別是基於上述Map型別的，於是直接歸納其關聯，這樣簡潔明瞭。

1、HashSet繼承AbstractSet類，實現了Set等介面，但最重要的是HashSet是基於HashMap來實現的。先看建構函式：

/**
         * 預設建構函式
         * 初始化一個空的HashMap，並使用預設初始容量為16和載入因子0.75。
         */
        public HashSet() {
            map = new HashMap<>();
        }

        /**
         * 構造一個包含指定 collection 中的元素的新 set。
         */
        public HashSet(Collection<? extends E> c) {
            map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16));
            addAll(c);
        }

        /**
         * 構造一個新的空 set，其底層 HashMap 例項具有指定的初始容量和指定的載入因子
         */
        public HashSet(int initialCapacity, float loadFactor) {
            map = new HashMap<>(initialCapacity, loadFactor);
        }

        /**
         * 構造一個新的空 set，其底層 HashMap 例項具有指定的初始容量和預設的載入因子（0.75）。
         */
        public HashSet(int initialCapacity) {
           map = new HashMap<>(initialCapacity);
        }

        /**
         * 以指定的initialCapacity和loadFactor構造一個新的空連結雜湊集合。
         * dummy 為標識 該建構函式主要作用是對LinkedHashSet起到一個支援作用
         */
        HashSet(int initialCapacity, float loadFactor, boolean dummy) {
           map = new LinkedHashMap<>(initialCapacity, loadFactor);
        }

從各個建構函式可以看出，HashSet在構造時都會構造出一個HashMap。HashSet將資料儲存到HashMap的key中，因為key是不可重複的，這就滿足了HashSet中的值不會重複；而HashMap中的值會放入一個虛擬的object物件。正是由於HashSet是基於HashMap實現的，它的相關操作都是直接呼叫底層的HashMap的相關方法來實現的。HashSet原始碼如下：

/** 
     * 返回對此set中元素進行迭代的迭代器。返回元素的順序並不是特定的。 
     * @return 對此set中元素進行迭代的Iterator。 
     */  
    public Iterator<E> iterator() {  
    return map.keySet().iterator();  
    }  
  
    /** 
     * 返回此set中的元素的數量（set的容量）。 
     * 
     * 底層實際呼叫HashMap的size()方法返回Entry的數量，就得到該Set中元素的個數。 
     * @return 此set中的元素的數量（set的容量）。 
     */  
    public int size() {  
    return map.size();  
    }  
  
    /** 
     * 如果此set不包含任何元素，則返回true。 
     * 
     * 底層實際呼叫HashMap的isEmpty()判斷該HashSet是否為空。 
     * @return 如果此set不包含任何元素，則返回true。 
     */  
    public boolean isEmpty() {  
    return map.isEmpty();  
    }  
  
    /** 
     * 如果此set包含指定元素，則返回true。 
     * 更確切地講，當且僅當此set包含一個滿足(o==null ? e==null : o.equals(e)) 
     * 的e元素時，返回true。 
     * 
     * 底層實際呼叫HashMap的containsKey判斷是否包含指定key。 
     * @param o 在此set中的存在已得到測試的元素。 
     * @return 如果此set包含指定元素，則返回true。 
     */  
    public boolean contains(Object o) {  
    return map.containsKey(o);  
    }  
  
    /** 
     * 如果此set中尚未包含指定元素，則新增指定元素。 
     * 更確切地講，如果此 set 沒有包含滿足(e==null ? e2==null : e.equals(e2)) 
     * 的元素e2，則向此set 新增指定的元素e。 
     * 如果此set已包含該元素，則該呼叫不更改set並返回false。 
     * 
     * 底層實際將將該元素作為key放入HashMap。 
     * 由於HashMap的put()方法新增key-value對時，當新放入HashMap的Entry中key 
     * 與集合中原有Entry的key相同（hashCode()返回值相等，通過equals比較也返回true）， 
     * 新新增的Entry的value會將覆蓋原來Entry的value，但key不會有任何改變， 
     * 因此如果向HashSet中新增一個已經存在的元素時，新新增的集合元素將不會被放入HashMap中， 
     * 原來的元素也不會有任何改變，這也就滿足了Set中元素不重複的特性。 
     * @param e 將新增到此set中的元素。 
     * @return 如果此set尚未包含指定元素，則返回true。 
     */  
    public boolean add(E e) {  
    return map.put(e, PRESENT)==null;  
    }  
  
    /** 
     * 如果指定元素存在於此set中，則將其移除。 
     * 更確切地講，如果此set包含一個滿足(o==null ? e==null : o.equals(e))的元素e， 
     * 則將其移除。如果此set已包含該元素，則返回true 
     * （或者：如果此set因呼叫而發生更改，則返回true）。（一旦呼叫返回，則此set不再包含該元素）。 
     * 
     * 底層實際呼叫HashMap的remove方法刪除指定Entry。 
     * @param o 如果存在於此set中則需要將其移除的物件。 
     * @return 如果set包含指定元素，則返回true。 
     */  
    public boolean remove(Object o) {  
    return map.remove(o)==PRESENT;  
    }  
  
    /** 
     * 從此set中移除所有元素。此呼叫返回後，該set將為空。 
     * 
     * 底層實際呼叫HashMap的clear方法清空Entry中所有元素。 
     */  
    public void clear() {  
    map.clear();  
    }  
  
    /** 
     * 返回此HashSet例項的淺表副本：並沒有複製這些元素本身。 
     * 
     * 底層實際呼叫HashMap的clone()方法，獲取HashMap的淺表副本，並設定到HashSet中。 
     */  
    public Object clone() {  
        try {  
            HashSet<E> newSet = (HashSet<E>) super.clone();  
            newSet.map = (HashMap<E, Object>) map.clone();  
            return newSet;  
        } catch (CloneNotSupportedException e) {  
            throw new InternalError();  
        }  
    }  
}

2、LinkedHashSet

LinkedHashSet繼承了HashSet，又基於LinkedHashMap來實現。LinkedHashSet底層使用LinkedHashMap的key來儲存所有元素，從而維護著一個運行於所有元素的雙向連結串列。該雙向連結串列定義了迭代順序，該順序分為插入順序和訪問順序（具體請看：LinkedHashMap內部實現）。因為它繼承了父類HashSet，所以它的所有操作方法都與HashSet相同，直接呼叫父類的方法即可。其中，HashSet還專為LinkedHashSet提供了構造方法，由於包訪問許可權，並未對外公開。程式碼如下：

/** 
     * 以指定的initialCapacity和loadFactor構造一個新的空連結雜湊集合。  
     * 
     * 實際底層會以指定的引數構造一個空LinkedHashMap例項來實現。 
     * @param initialCapacity 初始容量。 
     * @param loadFactor 載入因子。 
     * @param dummy 標記。 
     */  
    HashSet(int initialCapacity, float loadFactor, boolean dummy) {  
    map = new LinkedHashMap<E,Object>(initialCapacity, loadFactor);  
    }

3、TreeSet

TreeSet繼承自AbstractSet，又基於TreeMap實現，因為TreeSet底層使用一個TreeMap，它的元素儲存在TreeMap的key中，保證了不可重複性。同時，TreeSet中的元素也是排好序的，操作的時間複雜度也與TreeMap相同。與HashSet類似的是，TreeSet的大部分方法也是直接呼叫TreeMap中的方法。（關於TreeMap，請看：TreeMap內部實現）。其中，TreeSet的建構函式程式碼如下所示：

public class TreeSet<E> extends AbstractSet<E> 
    implements NavigableSet<E>, Cloneable, java.io.Serializable 
 { 
    // 使用 NavigableMap 的 key 來儲存 Set 集合的元素
    private transient NavigableMap<E,Object> m; 
    // 使用一個 PRESENT 作為 Map 集合的所有 value。
    private static final Object PRESENT = new Object(); 
    // 包訪問許可權的構造器，以指定的 NavigableMap 物件建立 Set 集合
    TreeSet(NavigableMap<E,Object> m) 
    { 
        this.m = m; 
    } 
    public TreeSet()                                      // 預設建構函式
    { 
        // 以自然排序方式建立一個新的 TreeMap，
        // 根據該 TreeSet 建立一個 TreeSet，
        // 使用該 TreeMap 的 key 來儲存 Set 集合的元素
        this(new TreeMap<E,Object>()); 
    } 
    public TreeSet(Comparator<? super E> comparator) 
    { 
        // 以定製排序方式建立一個新的 TreeMap，
        // 根據該 TreeSet 建立一個 TreeSet，
        // 使用該 TreeMap 的 key 來儲存 Set 集合的元素
        this(new TreeMap<E,Object>(comparator)); 
    } 
    public TreeSet(Collection<? extends E> c) 
    { 
        // 呼叫預設建構函式建立一個 TreeSet，底層以 TreeMap 儲存集合元素
        this(); 
        // 向 TreeSet 中新增 Collection 集合 c 裡的所有元素
        addAll(c); 
    } 
    public TreeSet(SortedSet<E> s) 
    { 
        //呼叫含有比較器引數的建構函式
        this(s.comparator()); 
        // 向 TreeSet 中新增 SortedSet 集合 s 裡的所有元素
        addAll(s); 
    } 
    //TreeSet 的其他方法都只是直接呼叫 TreeMap 的方法來提供實現
    ... 
}

HashSet、LinkedHashSet、TreeSet的內部實現簡介

HashSet、LinkedHashSet、TreeSet的內部實現簡介

HashSet、LinkedHashSet、TreeSet+JAVA學習筆記-DAY17

Set集合及其子集合HashSet 、LinkedHashSet、TreeSet；Map集合及其子集合HashMap、Hashtable；Collections(集合工具類)；IO概述和異常

Java集合之HashSet、LinkedHashSet、TreeSet

java集合（10）——HashSet、LinkedHashSet和TreeSet辨析

HashSet、LinkedHashSet、TreeSet使用區別

Java的集合set中HashSet、LinkedHashSet、TreeSet用法比較

java集合 List （ArrayList、linkedList、Vector、Stack） Set（HashSet、LinkedHashSet、TreeSet） Queue Map

Java集合之四Set、HashSet、LinkedHashSet、TreeSet

集合框架（四）如何使用以及何時使用HashSet、LinkedHashSet或者TreeSet來儲存元素

Java集合系列(三)：HashSet、LinkedHashSet、TreeSet的使用方法及區別

Java Set 常用集合 HashSet、LinkedHashSet、TreeSet

Java原始碼分析——java.util工具包解析（二）——HashSet、TreeSet、LinkedHashSet類解析

java-Set集合、HashSet集合、LinkedHashSet集合和TreeSet集合

Java集合Set、Map、HashSet、HashMap、TreeSet、TreeMap等

【學習筆記】平衡二叉樹（AVL樹）簡介及其查詢、插入、建立操作的實現

各種集合框架的總結ArrayList、LinkedList、Vector、HashMap、HashTable、HashSet、LinkedHaSet、TreeSet、ConcurrentHashMap

ML之LS&OLS：LS&OLS演算法的簡介、論文、演算法的改進(最佳子集選擇法、前向逐步迴歸法)、程式碼實現等詳細攻略

ML之LiR之PLiR：懲罰線性迴歸PLiR演算法簡介、分類、程式碼實現之詳細攻略

java中的幾種泛型類——HashSet、HashMap、TreeSet、TreeMap，遍歷map，排序，HashTable比較

HashSet、LinkedHashSet、TreeSet的內部實現簡介

相關推薦