HashSet底層存儲元素的源碼分析

阿新 • • 發佈：2018-05-25

false res pin 支持哈希表 nod 一個 tin IE

技術分享圖片

此類實現 Set 接口，由哈希表（實際上是一個 HashMap 實例）支持。它不保證 set 的叠代順序；特別是它不保證該順序恒久不變。此類允許使用 null 元素。

HashSet<String> set = new HashSet<String>();
set.add("abc");

 1      private transient HashMap<E,Object> map;
 2     /**
 7      * Constructs a new, empty set; the backing <tt>HashMap</tt> instance has
 
 8      * default initial capacity (16) and load factor (0.75).
 9      */
10     public HashSet() {
11         map = new HashMap<>();
12     }

點擊

HashSet

進入看Hash源碼，證明它確實是由一個 HashMap 實例支持。

眾所周知，set是無序，不重復的。那麽它是如何保證元素唯一性的呢？

先看源碼。點擊 add方法進入。

public boolean add(E e) {
        return map.put(e, PRESENT)==null 
;
    }

public V put(K key, V value) {
        return putVal(hash(key), key, value, false, true);
    }

 1 final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
 2                    boolean evict) {
 3         Node<K,V>[] tab; Node<K,V> p; int n, i;
 4         if ((tab = table) == null 
 || (n = tab.length) == 0)
 5             n = (tab = resize()).length;
 6         if ((p = tab[i = (n - 1) & hash]) == null)
 7             tab[i] = newNode(hash, key, value, null);
 8         else {
 9             Node<K,V> e; K k;
10             if (p.hash == hash &&
11                 ((k = p.key) == key || (key != null && key.equals(k))))
12                 e = p;
13             else if (p instanceof TreeNode)
14                 e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
15             else {
16                 for (int binCount = 0; ; ++binCount) {
17                     if ((e = p.next) == null) {
18                         p.next = newNode(hash, key, value, null);
19                         if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
20                             treeifyBin(tab, hash);
21                         break;
22                     }
23                     if (e.hash == hash &&
24                         ((k = e.key) == key || (key != null && key.equals(k))))
25                         break;
26                     p = e;
27                 }
28             }
29             if (e != null) { // existing mapping for key
30                 V oldValue = e.value;
31                 if (!onlyIfAbsent || oldValue == null)
32                     e.value = value;
33                 afterNodeAccess(e);
34                 return oldValue;
35             }
36         }
37         ++modCount;
38         if (++size > threshold)
39             resize();
40         afterNodeInsertion(evict);
41         return null;
42     }

1 static final int hash(Object key) {
2         int h;
3         return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
4     }

通過以上源碼，可以發現為保證唯一性。

1.將傳入的元素進行hashCode方法調用，得到該元素的hash值。拿到hash值還需要和數組的長度進行運算，獲取元素存儲的下標值。

獲取元素存儲的下標值，嘗試將傳入的元素存儲到對應的下標中。

2.如果計算出來的下標中，不存在元素，則直接存儲。否則執行第3步的equals方法。

3.如果存儲對象的equals方法返回true，說明是一樣的，所以不存。如果返回false，說明不一樣，要存儲起來。

4.使用“單鏈表”將存儲數據鏈接起來。

那麽單鏈表是什麽樣子的代碼呢？

Node<K,V> next; 這就是單鏈表的數據結構

 1  static class Node<K,V> implements Map.Entry<K,V> {
 2         final int hash;
 3         final K key;
 4         V value;
 5         Node<K,V> next;
 6 
 7         Node(int hash, K key, V value, Node<K,V> next) {
 8             this.hash = hash;
 9             this.key = key;
10             this.value = value;
11             this.next = next;
12         }
13 
14         public final K getKey()        { return key; }
15         public final V getValue()      { return value; }
16         public final String toString() { return key + "=" + value; }
17 
18         public final int hashCode() {
19             return Objects.hashCode(key) ^ Objects.hashCode(value);
20         }
21 
22         public final V setValue(V newValue) {
23             V oldValue = value;
24             value = newValue;
25             return oldValue;
26         }
27 
28         public final boolean equals(Object o) {
29             if (o == this)
30                 return true;
31             if (o instanceof Map.Entry) {
32                 Map.Entry<?,?> e = (Map.Entry<?,?>)o;
33                 if (Objects.equals(key, e.getKey()) &&
34                     Objects.equals(value, e.getValue()))
35                     return true;
36             }
37             return false;
38         }
39     }

技術分享圖片

這個就是hashSet的存儲圖。其中紅色的線就是鏈表線。

這個單鏈表具體長這樣的：

技術分享圖片

最後結論：HashSet底層依賴HashMap來實現。使用Node數組與單鏈表來實現元素的存儲。

HashSet底層存儲元素的源碼分析

false res pin 支持哈希表 nod 一個 tin IE 此類實現 Set 接口，由哈希表（實際上是一個 HashMap 實例）支持。它不保證 set 的叠代順序；特別是它不保證該順序恒久不變。此類允許使用 null 元素。 HashSet<St

JDK動態代理[2]----JDK動態代理的底層實現之Proxy源碼分析

sco 不可 -- 例如 mis tfs err eno entity 在上一篇裏為大家簡單介紹了什麽是代理模式？為什麽要使用代理模式？並用例子演示了一下靜態代理和動態代理的實現，分析了靜態代理和動態代理各自的優缺點。在這一篇中筆者打算深入源碼為大家剖析JDK動態代理實現的

Set存儲元素為啥是唯一的(以HashSet為例源碼分析)

final htm iat boolean targe ati 1.8 分享 hashmap 本文版權歸遠方的風lyh和博客園共有，歡迎轉載，但須保留此段聲明，並給出原文鏈接，謝謝合作，如有錯誤之處忘不吝批評指正! 說些廢話　　以前面試的時候會遇到有人問Set 和l

java-通過 HashMap、HashSet 的源碼分析其 Hash 存儲機制

內存空間壓縮文件 lca 中一 implement content 來看查詢 emp 通過 HashMap、HashSet 的源碼分析其 Hash 存儲機制集合和引用就像引用類型的數組一樣，當我們把 Java 對象放入數組之時，並非真正的把 Ja

HashSet存儲元素保證唯一性的代碼及圖解

tor port 自定義 ima result string main ide col 需求：存儲自定義對象，並保證元素的唯一性要求：如果兩個對象的成員變量值都相同，則為同一個元素。示例代碼如下： 1 package cn.itcast_02; 2 3

《深入理解Spark-核心思想與源碼分析》（四）第三章存儲體系

配置信息 ger nbsp 效率提升理解 hadoop 任務深入天行健，君子以自強不息；地勢坤，君子以厚德載物。——《易經》本章導讀　　Spark的初始化階段、任務提交階段、執行階段，始終離不開存儲體系。　　Spark為了避免Hadoop讀寫磁盤的I/O操

並發編程（四）：ThreadLocal從源碼分析總結到內存泄漏

ngs 一個交互而且當前 logs 點雲然而垃圾一、目錄 1、ThreadLocal是什麽？有什麽用？ 2、ThreadLocal源碼簡要總結？ 3、ThreadLocal為什麽會導致內存泄漏？二、ThreadLocal是

Java中HashMap底層實現原理(JDK1.8)源碼分析

blank imp dash logs || 屬性 lte das ces 這幾天學習了HashMap的底層實現,但是發現好幾個版本的，代碼不一，而且看了Android包的HashMap和JDK中的HashMap的也不是一樣，原來他們沒有指定JDK版本，很多文章都是舊版本J

memcached源碼分析-----slab內存分配器

details 初始化 allocator 內存碎片時間 ng- 遍歷 thread 失敗溫馨提示：本文用到了一些可以在啟動memcached設置的全局變量。關於這些全局變量的含義可以參考《memcached啟動參數詳解》。對於這些全局變量，處理方式就像

lodash源碼分析之緩存使用方式的進一步封裝

倉庫 org add dex 公眾號 null define 民族數組在世界上所有的民族之中，支配著他們的喜怒選擇的並不是天性，而是他們的觀點。 ——盧梭《社會與契約論》本文為讀 lodash 源碼的第九篇，後續文章會更新到這個倉庫中，歡迎 star：pocket

nginx源碼分析——內存池

line ptr del bug efi 自身 free 填充 res ngx_palloc.h /* * Copyright (C) Igor Sysoev * Copyright (C) Nginx, Inc. */ #ifndef _NGX_PALLOC_

HashSet源碼分析 jdk1.6

nsa body contain mod com contains odi retain actor Set的特點：Set元素無順序，且元素不可以重復。 1、定義 public class HashSet<E> extends AbstractSet<E

linux內存源碼分析 - SLAB分配器概述

image 問題 src 效率單鏈表應該內部 class 引用本文為原創，轉載請註明：http://www.cnblogs.com/tolimit/ 之前說了管理區頁框分配器，這裏我們簡稱為頁框分配器，在頁框分配器中主要是管理物理內存，將物理內存的頁框分配給申請者，

Spring源碼分析（十三）緩存中獲取單例bean

ould for 目的存儲不同單例 color 正在 span 摘要：本文結合《Spring源碼深度解析》來分析Spring 5.0.6版本的源代碼。若有描述錯誤之處，歡迎指正。介紹過FactoryBean的用法後，我們就可以了解bean加載的過程了。前面已

實際測試例子+源碼分析的方式解剖MyBatis緩存的概念

設置一級緩存清除 null 查詢 rop 博客M tostring swa 前言：前方高能！本文內容有點多，通過實際測試例子+源碼分析的方式解剖MyBatis緩存的概念，對這方面有興趣的小夥伴請繼續看下去~ MyBatis緩存介紹首先看一段wiki上關於MyBati

【轉】MaBatis學習---源碼分析MyBatis緩存原理

iso 負責等待全局安全問題 cto suse 都去 pst 【原文】https://www.toutiao.com/i6594029178964673027/ 源碼分析MyBatis緩存原理 1.簡介在 Web 應用中，緩存是必不可少的組件。通常我們都會用 Red

通過源碼分析MyBatis的緩存

true hex int 代碼 ase 是個 .com style bool 　　看了通過源碼分析MyBatis的緩存這篇文章後，自己跟著源碼過了一遍，對mybatis的一級緩存和二級緩存有了更清楚的認識。　　一級緩存是SqlSession級別的，同一個sqlSessio

JDK源碼分析(五)——HashSet

http time ble 實現 addall can tor previous transient 目錄 HashSet概述內部字段及構造方法存儲元素刪除元素包含元素總結 HashSet概述 ??從前面開始，已經分析過集合中的List和Map，今天來介紹另一

STL源碼分析之內存池

重新其他 except 多次調用源碼 stl lis 他能 data 前言上一節只分析了第二級配置器是由多個鏈表來存放相同內存大小, 當沒有空間的時候就向內存池索取就行了, 卻沒有具體分析內存池是怎麽保存空間的, 是不是內存池真的有用不完的內存, 本節我們就具體來分析

死磕 java集合之HashSet源碼分析

ini eof 遍歷源碼分析 nts keyset exceptio mas 區別問題（1）集合（Collection）和集合（Set）有什麽區別？（2）HashSet怎麽保證添加元素不重復？（3）HashSet是否允許null元素？（4）HashSet是有序的

HashSet底層存儲元素的源碼分析

相關推薦