死磕Java之聊聊HashSet原始碼(基於JDK1.8)

阿新 • • 發佈：2019-01-02

HashSet的UML圖

HashMap的UML圖

HashSet的成員變數及其含義

public class HashSet<E>
    extends AbstractSet<E>
    implements Set<E>, Cloneable, java.io.Serializable
{
    static final long serialVersionUID = -5024744406713321676L;

      // 底層使用HashMap來儲存HashSet中所有元素。  
    private transient HashMap<E,Object> map;  

    // 定義一個虛擬的Object物件作為HashMap的value，將此物件定義為static final。   

    private static final Object PRESENT = new Object();  
<!--more-->
    /** 
     * 預設的無參構造器，構造一個空的HashSet。 
     *  
     * 實際底層會初始化一個空的HashMap，並使用預設初始容量為16和載入因子0.75。 
     */  
    public HashSet() {  
    map = new HashMap<E,Object>();  
    }  

    /** 
     * 構造一個包含指定collection中的元素的新set。 
     * 
     * 實際底層使用預設的載入因子0.75和足以包含指定 
     * collection中所有元素的初始容量來建立一個HashMap。 
     * @param 
 c 其中的元素將存放在此set中的collection。 
     */  
    public HashSet(Collection<? extends E> c) {  
    map = new HashMap<E,Object>(Math.max((int) (c.size()/.75f) + 1, 16));  
    addAll(c);  
    }  

    /** 
     * 以指定的initialCapacity和loadFactor構造一個空的HashSet。 
     * 
     * 實際底層以相應的引數構造一個空的HashMap。 
     * @param 
 initialCapacity 初始容量。 
     * @param loadFactor 載入因子。 
     */  
    public HashSet(int initialCapacity, float loadFactor) {  
    map = new HashMap<E,Object>(initialCapacity, loadFactor);  
    }  

    /** 
     * 以指定的initialCapacity構造一個空的HashSet。 
     * 
     * 實際底層以相應的引數及載入因子loadFactor為0.75構造一個空的HashMap。 
     * @param initialCapacity 初始容量。 
     */  
    public HashSet(int initialCapacity) {  
    map = new HashMap<E,Object>(initialCapacity);  
    }  

    /** 
     * 以指定的initialCapacity和loadFactor構造一個新的空連結雜湊集合。 
     * 此建構函式為包訪問許可權，不對外公開，實際只是是對LinkedHashSet的支援。 
     * 
     * 實際底層會以指定的引數構造一個空LinkedHashMap例項來實現。 
     * @param initialCapacity 初始容量。 
     * @param loadFactor 載入因子。 
     * @param dummy 標記。 
     */  
    HashSet(int initialCapacity, float loadFactor, boolean dummy) {  
    map = new LinkedHashMap<E,Object>(initialCapacity, loadFactor);  
    }  
}

聊聊HashSet的主要方法實現


     /** 
     * 返回對此set中元素進行迭代的迭代器。返回元素的順序並不是特定的。 
     *  
     * 底層實際呼叫底層HashMap的keySet來返回所有的key。 
     * 可見HashSet中的元素，只是存放在了底層HashMap的key上， 
     * value使用一個static final的Object物件標識。 
     * @return 對此set中元素進行迭代的Iterator。 
     */  
    public Iterator<E> iterator() {  
    return map.keySet().iterator();  
    }  

    /** 
     * 返回此set中的元素的數量（set的容量）。 
     * 
     * 底層實際呼叫HashMap的size()方法返回Entry的數量，就得到該Set中元素的個數。 
     * @return 此set中的元素的數量（set的容量）。 
     */  
    public int size() {  
    return map.size();  
    }  

    /** 
     * 如果此set不包含任何元素，則返回true。 
     * 
     * 底層實際呼叫HashMap的isEmpty()判斷該HashSet是否為空。 
     * @return 如果此set不包含任何元素，則返回true。 
     */  
    public boolean isEmpty() {  
    return map.isEmpty();  
    }  

    /** 
     * 如果此set包含指定元素，則返回true。 
     * 更確切地講，當且僅當此set包含一個滿足(o==null ? e==null : o.equals(e)) 
     * 的e元素時，返回true。 
     * 
     * 底層實際呼叫HashMap的containsKey判斷是否包含指定key。 
     * @param o 在此set中的存在已得到測試的元素。 
     * @return 如果此set包含指定元素，則返回true。 
     */  
    public boolean contains(Object o) {  
    return map.containsKey(o);  
    }  

    /** 
     * 如果此set中尚未包含指定元素，則新增指定元素。 
     * 更確切地講，如果此 set 沒有包含滿足(e==null ? e2==null : e.equals(e2)) 
     * 的元素e2，則向此set 新增指定的元素e。 
     * 如果此set已包含該元素，則該呼叫不更改set並返回false。 
     * 
     * 底層實際將將該元素作為key放入HashMap。 
     * 由於HashMap的put()方法新增key-value對時，當新放入HashMap的Entry中key 
     * 與集合中原有Entry的key相同（hashCode()返回值相等，通過equals比較也返回true）， 
     * 新新增的Entry的value會將覆蓋原來Entry的value，但key不會有任何改變， 
     * 因此如果向HashSet中新增一個已經存在的元素時，新新增的集合元素將不會被放入HashMap中， 
     * 原來的元素也不會有任何改變，這也就滿足了Set中元素不重複的特性。 
     * @param e 將新增到此set中的元素。 
     * @return 如果此set尚未包含指定元素，則返回true。 
     */  
    public boolean add(E e) {  
    return map.put(e, PRESENT)==null;  
    }  

    /** 
     * 如果指定元素存在於此set中，則將其移除。 
     * 更確切地講，如果此set包含一個滿足(o==null ? e==null : o.equals(e))的元素e， 
     * 則將其移除。如果此set已包含該元素，則返回true 
     * （或者：如果此set因呼叫而發生更改，則返回true）。（一旦呼叫返回，則此set不再包含該元素）。 
     * 
     * 底層實際呼叫HashMap的remove方法刪除指定Entry。 
     * @param o 如果存在於此set中則需要將其移除的物件。 
     * @return 如果set包含指定元素，則返回true。 
     */  
    public boolean remove(Object o) {  
    return map.remove(o)==PRESENT;  
    }  

    /** 
     * 從此set中移除所有元素。此呼叫返回後，該set將為空。 
     * 
     * 底層實際呼叫HashMap的clear方法清空Entry中所有元素。 
     */  
    public void clear() {  
    map.clear();  
    }  

    /** 
     * 返回此HashSet例項的淺表副本：並沒有複製這些元素本身。 
     * 
     * 底層實際呼叫HashMap的clone()方法，獲取HashMap的淺表副本，並設定到HashSet中。 
     */  
    public Object clone() {  
        try {  
            HashSet<E> newSet = (HashSet<E>) super.clone();  
            newSet.map = (HashMap<E, Object>) map.clone();  
            return newSet;  
        } catch (CloneNotSupportedException e) {  
            throw new InternalError();  
        }  
    }

聊聊HashSet與HashMap的關係

從上面的原始碼可以看出來，HashSet與HashMap的關係不可謂不密切，以至於不敢相信上面的UML是對的。因此，對於HashSet而言，它是基於HashMap實現的，HashSet底層使用HashMap來儲存所有元素，因此HashSet原始碼的實現比較簡單，相關HashSet的操作，都是直接呼叫底層HashMap的相關方法來完成

小結

從原始碼來看，HashSet無非是一個閹割版的HashMap，所以要想明白HashSet的實現原理，HashMap原始碼坑還是要跳的
對於HashSet中儲存的物件，請注意正確重寫其equals和hashCode方法，以保證放入的物件的唯一性。
Set是利用底層的Map對於重複的key不放入的特性來保證元素的不重複的
HashSet沒有提供get()方法，原因是同HashMap一樣，Set內部是無序的，只能通過迭代的方式獲得

參考文章

死磕Java之聊聊HashSet原始碼(基於JDK1.8)

HashSet的UML圖 HashSet的成員變數及其含義 public class HashSet<E> extends AbstractSet<E> implements Set<E>, C

死磕Java之聊聊ArrayList原始碼(基於JDK1.8)

工作快一年了，近期打算研究一下JDK的原始碼，也就因此有了死磕java系列 ArrayList 是一個數組佇列，相當於動態陣列。與Java中的陣列相比，它的容量能動態增長。它繼承於AbstractList，實現了List, RandomAccess, Clo

淺談java執行緒池（基於jdk1.8）

多執行緒讓程式世界豐富多彩，也讓其錯綜複雜。對於執行緒的建立和銷燬成了一筆不小的開銷，為了減少這些開銷，出現了執行緒池。執行緒池對執行緒進行管理，對於需要使用多執行緒的你來說，只需要把你的任務丟給執行緒池就可以了。當你把任務丟給執行緒池的時候，它是如何處理的呢？

刨死你係列——LinkedHashMap剖析（基於jdk1.8）

一、概述　　1.8版本的LinkedHashMap 繼承自 HashMap，在 HashMap（陣列連結串列+紅黑樹）基礎上，通過維護一條雙向連結串列，解決了 HashMap 不能隨時保持遍歷順序和插入順序一致的問題。除此之外，LinkedHashMap 對訪問順序也提供了相關支援。在一些場景下，該特性很

死磕 java集合之HashSet源碼分析

ini eof 遍歷源碼分析 nts keyset exceptio mas 區別問題（1）集合（Collection）和集合（Set）有什麽區別？（2）HashSet怎麽保證添加元素不重復？（3）HashSet是否允許null元素？（4）HashSet是有序的

死磕 java併發包之AtomicStampedReference原始碼分析（ABA問題詳解）

問題（1）什麼是ABA？（2）ABA的危害？（3）ABA的解決方法？（4）AtomicStampedReference是什麼？（5）AtomicStampedReference是怎麼解決ABA的？簡介 AtomicStampedReference是java併發包下提供的一個原子類，它能解決其它原子

死磕 java併發包之LongAdder原始碼分析

問題（1）java8中為什麼要新增LongAdder？（2）LongAdder的實現方式？（3）LongAdder與AtomicLong的對比？簡介 LongAdder是java8中新增的原子類，在多執行緒環境中，它比AtomicLong效能要高出不少，特別是寫多的場景。它是怎麼實現的呢？讓我們一起

死磕 java同步系列之ReentrantLock原始碼解析（一）——公平鎖、非公平鎖

問題（1）重入鎖是什麼？（2）ReentrantLock如何實現重入鎖？（3）ReentrantLock為什麼預設是非公平模式？（4）ReentrantLock除了可重入還有哪些特性？簡介 Reentrant = Re + entrant，Re是重複、又、再的意思，entrant是enter的名詞或

死磕 java同步系列之ReentrantLock原始碼解析（二）——條件鎖

問題（1）條件鎖是什麼？（2）條件鎖適用於什麼場景？（3）條件鎖的await()是在其它執行緒signal()的時候喚醒的嗎？簡介條件鎖，是指在獲取鎖之後發現當前業務場景自己無法處理，而需要等待某個條件的出現才可以繼續處理時使用的一種鎖。比如，在阻塞佇列中，當佇列中沒有元素的時候是無法彈出一個元素

死磕 java同步系列之ReentrantReadWriteLock原始碼解析

問題（1）讀寫鎖是什麼？（2）讀寫鎖具有哪些特性？（3）ReentrantReadWriteLock是怎麼實現讀寫鎖的？（4）如何使用ReentrantReadWriteLock實現高效安全的TreeMap？簡介讀寫鎖是一種特殊的鎖，它把對共享資源的訪問分為讀訪問和寫訪問，多個執行緒可以同時對共享

死磕 java同步系列之Semaphore原始碼解析

問題（1）Semaphore是什麼？（2）Semaphore具有哪些特性？（3）Semaphore通常使用在什麼場景中？（

死磕 java同步系列之CountDownLatch原始碼解析

死磕 java同步系列之StampedLock原始碼解析

問題（1）StampedLock是什麼？（2）StampedLock具有什麼特性？（3）StampedLock是否支援可重入

死磕 java同步系列之CyclicBarrier原始碼解析——有圖有真相

問題（1）CyclicBarrier是什麼？（2）CyclicBarrier具有什麼特性？（3）CyclicBarrier與

死磕 java集合之DelayQueue原始碼分析

問題（1）DelayQueue是阻塞佇列嗎？（2）DelayQueue的實現方式？（3）DelayQueue主要用於

死磕 java同步系列之Phaser原始碼解析

問題（1）Phaser是什麼？（2）Phaser具有哪些特性？（3）Phaser相對於CyclicBarrier和Count

【死磕Java並發】—–J.U.C之AQS（一篇就夠了）

ini tle 循環針對可能 width als 如果 boolean [隱藏目錄]1 獨占式1.1 獨占式同步狀態獲取1.2 獨占式獲取響應中斷1.3 獨占式超時獲取1.4 獨占式同步狀態釋放2 共享式2.1 共享式

死磕java concurrent包系列（三）基於ReentrantLock理解AQS的條件佇列

基於Codition分析AQS的條件佇列前言上一篇我們講了AQS中的同步佇列佇列，現在我們研究一下條件佇列。在java中最常見的加鎖方式就是synchorinzed和Reentrantlock，我們都說Reentrantlock比synchorinzed更加靈活，其實就靈活在Reentrantlock中

java集合之----ArrayList原始碼分析（基於jdk1.8）

一、ArrayList 1、ArrayList是什麼： ArrayList就是動態陣列，用MSDN中的說法，就是Array的複雜版本，它提供了動態的增加和減少元素，實現了ICollection和IList介面，靈活的設定陣列的大小等好處，實現了Randomaccess介面，支援快速隨

死磕java concurrent包系列（五）基於AQS的條件佇列把LinkedBlockingQueue“扒光”

LinkedBlockingQueue的基礎 LinkedBlockingQueue是一個基於連結串列的阻塞佇列，實際使用上與ArrayBlockingQueue完全一樣，我們只需要把之前烤雞的例子中的Queue物件替換一下即可。如果對於ArrayBlockingQueue不熟悉，可以去看看https://

死磕Java之聊聊HashSet原始碼(基於JDK1.8)

HashSet的UML圖

HashSet的成員變數及其含義

聊聊HashSet的主要方法實現

聊聊HashSet與HashMap的關係

小結

參考文章

相關推薦