HashSet原始碼分析，基於JDK1.8詳細分析

阿新 • • 發佈：2021-05-02

閱讀本文章之前推薦先閱讀博主關於HashMap的文章：
HashMap原始碼分析 + 面試題

HashSet原始碼分析

文章目錄

HashSet原始碼分析

一、基本介紹

底層實現基於 HashMap，所以迭代時不能保證按照插入順序或者其它順序進行迭代
add、remove、contanins、size 等方法的耗時效能，是不會隨著資料量的增加而增加的，這個主要跟 HashMap 底層的資料結構有關，不管資料量多大，不考慮 hash 衝突的情況下，時間複雜度都是 O (1)
執行緒不安全的，允許null值
迭代過程中，如果資料結構被改變，會快速失敗，丟擲 ConcurrentModificationException 異常
繼承體系

HashSet並沒有繼承HashMap，所以HashSet是通過呼叫HashMap的方法從而使用HashMap，這種不採用繼承而採用組合的方式的優點如下：
- 繼承表示父子類是同一個事物，而 Set 和 Map 本來就是兩種事物，所以繼承不妥，而且 Java 語法限制子類只能繼承一個父類，後續難以擴充套件
- 組合更加靈活，可以任意的組合現有的基礎類，並且可以在基礎類方法的基礎上進行擴充套件、編排等，而且方法命名可以任意命名，無需和基礎類的方法名稱保持一致

二、原始碼分析

1. 成員變數

//把HashMap組合進來，key是Hashset的key，value是下面的PRESENT
private transient HashMap<E,Object> map;

//HashMap中的虛擬value
private static final Object PRESENT = new Object();

觀察上述原始碼，可以得出如下結論：

使用 HashSet 時，比如 add 方法，只有一個入參，但組合的 Map 的 add 方法卻有 key、value 兩個入參，Map 的 key 就是 add 的入參，value 就是上述程式碼中的第二個屬性 PRESENT，此處設計非常巧妙，用一個預設值 PRESENT 來代替 Map 的 Value
- 也就是說這個map中所有的value都是一樣的
當多個執行緒訪問HashSet時，就會有執行緒安全問題，因為在後續的所有操作中，並沒有加鎖

2. 構造方法

//底層呼叫HashMap的構造器
public HashSet() {
    map = new HashMap<>();
}

public HashSet(int initialCapacity) {
    map = new HashMap<>(initialCapacity);
}

public HashSet(int initialCapacity, float loadFactor) {
    map = new HashMap<>(initialCapacity, loadFactor);
}

/**
* 如果給定引數集合的初始容量小於16 ，就按照HashMap預設的16初始化即可
* 如果大於16，就按照指定的值進行初始化
* 指定的值 = 引數集合容量 / 0.75 + 1，可以使得期望的值正好比擴容的閥值還大1，就不會擴容，符合HashMap擴容的公式，可以減少擴容次數，提高效率
*/
public HashSet(Collection<? extends E> c) {
    map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16));
    addAll(c);
}
//以後的開發過程中，如果要給HashMap中拷貝集合，HashMap的初始化大小可以借鑑這種寫法

//非public，只能被同一個包呼叫，這是LinkedHashSet專屬的構造器
HashSet(int initialCapacity, float loadFactor, boolean dummy) {
    map = new LinkedHashMap<>(initialCapacity, loadFactor);
    //建立的是LinkedHashMap，非HashMap
}

3. 新增方法

add(E e) 方法原始碼如下：

public boolean add(E e) {
    //直接呼叫HashMap的put()方法，把元素本身作為key，把PRESENT作為value
    return map.put(e, PRESENT)==null;
}

4. 刪除方法

remove(Object o) 方法原始碼如下：

public boolean remove(Object o) {
    //直接呼叫HashMap的remove()方法
    return map.remove(o)==PRESENT;
}

注意，Map的 remove 方法返回的是刪除元素的value，而Set的 remove 方法返回的是boolean型別，如果是null的話說明沒有該元素，如果不是null肯定等於PRESENT

5. 查詢方法

contains(Object o) 方法原始碼如下：

public boolean contains(Object o) {
    //呼叫map的containsKey()方法
    return map.containsKey(o);
}

6. 遍歷方法

iterator() 方法原始碼如下：

public Iterator<E> iterator() {
    //呼叫map的keySet的迭代器
    return map.keySet().iterator();
}

三、總結

（1）HashSet內部使用HashMap的key儲存元素，以此來保證元素不重複

（2）HashSet是無序的，因為HashMap的key是無序的

（3）HashSet中允許取值為null的元素，因為HashMap允許key為null

（4）HashSet是非執行緒安全的

（5）HashSet沒有 get() 方法，查詢方法是 contains() 方法

HashSet原始碼分析，基於JDK1.8詳細分析

閱讀本文章之前推薦先閱讀博主關於HashMap的文章： HashMap原始碼分析 + 面試題

PriorityQueue原始碼分析，基於JDK1.8詳細分析

閱讀本文章之前推薦先閱讀博主關於堆排序相關的內容，傳送地址：八大排序演算法大彙總原理+圖解+原始碼+複雜度分析

TreeMap原始碼分析（基於jdk1.8）

之前花了很多時間寫了HashMap，HashMap算是超級重要的一個知識點了，面試的時候特種問題各種變形都有可能會問到。相對於HashMap，好像TreeMap顯得有點不那麼重要了，但是常常會伴隨著HashMap來提問。因此花了一部分時

Map介面原始碼解析（基於jdk1.8.0_231）

Map 介面簡介提供根據key與value之間的對映關係，不可以有重複的key,每個key最多可以對映一個value;

HashTable原始碼淺析（基於jdk1.8.0_231）

HashTable 簡介 HashTable資料結構也是雜湊表(或稱散列表)，基本與HashMap型別，不同的是，HashTable的key value 都不可為空，且是執行緒安全的；

StringBuilder原始碼淺析（基於jdk1.8.0_231）

StringBuilder 簡介 StringBuild API StringBuild 原始碼淺析 package java.lang; /** * A mutable sequence of characters.This class provides an API compatible

StringBuffer原始碼淺析（基於jdk1.8,0_231）

StringBuffer簡介 StringBufferjich 類似於String類，但StringBuffer是執行緒安全的可變字串類；

ArrayList原始碼詳解（基於jdk1.8.0_251）

ArrayList簡介一種支援自動擴容的動態陣列,繼承了AbstractList實現了List, RandomAccess, Cloneable, java.io.Serializable,故支援隨機訪問，可克隆，可序列化等特性;

NavigableSet介面原始碼淺析(基於jdk1.8.0_231)

1. NavigableSet介面簡介根據“實現了啥介面,提供啥服務”原則，若類實現了NavigableSet介面，說明該類可以可以根據給定的搜尋目標，返回一個匹配簇，舉例通俗不嚴格地講，對於一個集合類若實現了NavigableSet介面

AtomicLong原始碼淺析(基於jdk1.8.0_231)

AtomicLong 簡介在32位作業系統中，64位的long 和 double 變數由於會被JVM當作兩個分離的32位來進行操作，所以不具有原子性。而AtomicLong能讓long的加1,減1操作,設定新值等操作在多執行緒中保持原子性；

Flag之String原始碼(基於jdk1.8)

這是一個flag! 新手小白對於原始碼的困惑！　　做初級開發的時候知道有原始碼，可是從來不會去主動看，因為工作上壓根用不到，而且原始碼的註釋全部是英文的，看起來壓力比較大，頭疼，每次一看見英文註釋就跳過，

（未完）Java集合框架梳理（基於JDK1.8）

Java集合類主要由兩個介面Collection和Map派生出來的，Collection派生出了三個子介面：List、Set、Queue（Java5新增的佇列），因此Java集合大致也可分成List、Set、Queue、Map四種介面體系

HashMap put原理詳解（基於jdk1.8）

此文轉載自：https://blog.csdn.net/weixin_49631226/article/details/110247453 前言本文是個人對Hashmap的一些個人見解，主要通過使用hashmapput的一些程式碼來闡述其底層實現原理，在面試中也會經常會用到，如

【轉】ArrayList擴容機制(基於jdk1.8)

轉載：https://blog.csdn.net/qq_26542493/article/details/88873168 一.ArrayList繼承了AbstractList，實現了List介面，底層實現基於陣列，因此可以認為是一個可變長度的陣列。

【故障分析】基於matlab軸承故障分析（時頻圖+功率譜）【含Matlab原始碼 922期】

一、簡介基於matlab軸承故障分析（時頻圖+功率譜）二、原始碼 clc clear all x1=load(\'sig1.txt\');

ArrayList擴容機制(基於jdk1.8)

一.ArrayList繼承了AbstractList，實現了List介面，底層實現基於陣列，因此可以認為是一個可變長度的陣列。二.在講擴容機制之前，我們需要了解一下ArrayList中最主要的幾個變數：

【語音分析】基於matlab倒譜分析與MFCC係數計算【含Matlab原始碼 556期】

一、簡介 1 梅爾頻率倒譜系數(MFCC) 在任意一個Automatic speech recognition 系統中，第一步就是提取特徵。換句話說，我們需要把音訊訊號中具有辨識性的成分提取出來，然後把其他的亂七八糟的資訊扔掉，例如背景噪聲

直播原始碼APP，基於google ExoPlayer 簡單自定義播放介面

直播原始碼APP，基於google ExoPlayer 簡單自定義播放介面實現的相關程式碼1.直播原始碼AP基於google ExoPlayer播放m3u8，mp4等檔案

新型PPT釣魚攻擊分析（含gootkit木馬詳細分析）

1 概述最近出現了一種新型的PPT釣魚攻擊方式，該種釣魚攻擊方式不需要巨集就能實現執行powershell的功能，通過網路下載gootkit木馬進行控制。

HashMap原始碼分析（jdk1.8，保證你能看懂）

現在的面試當中凡是那些大廠，基本上都會問到一些關於HashMap的問題了，而且這個集合在開發中也經常會使用到。於是花費了大量的時間去研究分析寫了這篇文章。本文是基於jdk1.8來分析的。篇幅較長，但是都是循序漸進的

HashSet原始碼分析，基於JDK1.8詳細分析

HashSet原始碼分析

文章目錄

一、基本介紹

二、原始碼分析

1. 成員變數

2. 構造方法

3. 新增方法

4. 刪除方法

5. 查詢方法

6. 遍歷方法

三、總結

相關推薦