【集合系列】- 深入淺出的分析IdentityHashMap

一、摘要

在集合系列的第一章，咱們瞭解到，Map 的實現類有 HashMap、LinkedHashMap、TreeMap、IdentityHashMap、WeakHashMap、Hashtable、Properties等等。

應該有很多人不知道 IdentityHashMap 的存在，其中不乏工作很多年的 Java 開發者，本文主要從資料結構和演算法層面，探討 IdentityHashMap 的實現。

二、簡介

IdentityHashMap 的資料結構很簡單，底層實際就是一個 Object 陣列，但是在儲存上並沒有使用連結串列來儲存，而是將 K 和 V 都存放在 Object 陣列上。

當新增元素的時候，會根據 Key 計算得到雜湊位置，如果發現該位置上已經有改元素，直接進行新值替換；如果沒有，直接進行存放。當元素個數達到一定閾值時，Object 陣列會自動進行擴容處理。

開啟 IdentityHashMap 的原始碼，可以看到 IdentityHashMap 繼承了AbstractMap 抽象類，實現了Map介面、可序列化介面、可克隆介面。

public class IdentityHashMap<K,V>
    extends AbstractMap<K,V>
    implements Map<K,V>, java.io.Serializable, Cloneable
{
    /**預設容量大小*/
    private static final int DEFAULT_CAPACITY = 32;
    
    /**最小容量*/
    private static final int MINIMUM_CAPACITY = 4;
    
    /**最大容量*/
    private static final int MAXIMUM_CAPACITY = 1 << 29;
    
    /**用於儲存實際元素的表*/
    transient Object[] table;
    
    /**陣列大小*/
    int size;

    /**對Map進行結構性修改的次數*/
    transient int modCount;

    /**key為null所對應的值*/
    static final Object NULL_KEY = new Object();
    
    ......
}

可以看到類的底層，使用了一個 Object 陣列來存放元素；在物件初始化時，IdentityHashMap 容量大小為64；

public IdentityHashMap() {
        //呼叫初始化方法
        init(DEFAULT_CAPACITY);
}

private void init(int initCapacity) {
        //陣列大小預設為初始化容量的2倍
        table = new Object[2 * initCapacity];
}

三、常用方法介紹

3.1、put方法

put 方法是將指定的 key, value 對新增到 map 裡。該方法首先會對map做一次查詢，通過==

判斷是否存在key，如果有，則將舊value返回，將新value覆蓋舊value；如果沒有，直接插入，陣列長度+1，返回null。

原始碼如下：

public V put(K key, V value) {
        //判斷key是否為空，如果為空，初始化一個Object為key
        final Object k = maskNull(key);

        retryAfterResize: for (;;) {
            final Object[] tab = table;
            final int len = tab.length;
            //通過key、length獲取陣列小編
            int i = hash(k, len);
            
            //迴圈遍歷是否存在指定的key
            for (Object item; (item = tab[i]) != null;
                 i = nextKeyIndex(i, len)) {
                 //通過==判斷，是否陣列中是否存在key
                if (item == k) {
                        V oldValue = (V) tab[i + 1];
                        //新value覆蓋舊value
                    tab[i + 1] = value;
                    //返回舊value
                    return oldValue;
                }
            }
            
            //陣列長度 +1
            final int s = size + 1;
            //判斷是否需要擴容
            if (s + (s << 1) > len && resize(len))
                continue retryAfterResize;

            //更新修改次數
            modCount++;
            //將k加入陣列
            tab[i] = k;
            //將value加入陣列
            tab[i + 1] = value;
            size = s;
            return null;
        }
}

maskNull 函式，判斷 key 是否為空

private static Object maskNull(Object key) {
        return (key == null ? NULL_KEY : key);
}

hash 函式，通過 key 獲取 hash 值，結合陣列長度通過位運算獲取陣列雜湊下標

private static int hash(Object x, int length) {
        int h = System.identityHashCode(x);
        // Multiply by -127, and left-shift to use least bit as part of hash
        return ((h << 1) - (h << 8)) & (length - 1);
}

nextKeyIndex 函式，通過 hash 函式計算得到的陣列雜湊下標，進行加2；因為一個 key、value 都存放在陣列中，所以一個 map 物件佔用兩個陣列下標，所以加2。

private static int nextKeyIndex(int i, int len) {
        return (i + 2 < len ? i + 2 : 0);
}

resize 函式，通過陣列長度，進行擴容處理，擴容之後的長度為當前長度的2倍

private boolean resize(int newCapacity) {
        //擴容後的陣列長度，為當前陣列長度的2倍
        int newLength = newCapacity * 2;

        Object[] oldTable = table;
        int oldLength = oldTable.length;
        if (oldLength == 2 * MAXIMUM_CAPACITY) { // can't expand any further
            if (size == MAXIMUM_CAPACITY - 1)
                throw new IllegalStateException("Capacity exhausted.");
            return false;
        }
        if (oldLength >= newLength)
            return false;

        Object[] newTable = new Object[newLength];
        //將舊陣列內容轉移到新陣列
        for (int j = 0; j < oldLength; j += 2) {
            Object key = oldTable[j];
            if (key != null) {
                Object value = oldTable[j+1];
                oldTable[j] = null;
                oldTable[j+1] = null;
                int i = hash(key, newLength);
                while (newTable[i] != null)
                    i = nextKeyIndex(i, newLength);
                newTable[i] = key;
                newTable[i + 1] = value;
            }
        }
        table = newTable;
        return true;
}

3.2、get方法

get 方法根據指定的 key 值返回對應的 value。同樣的，該方法會迴圈遍歷陣列，通過==判斷是否存在key，如果有，直接返回value，因為 key、value 是相鄰的儲存在陣列中，所以直接在當前陣列下標+1，即可獲取 value；如果沒有找到，直接返回null。

值得注意的地方是，在迴圈遍歷中，是通過==判斷當前元素是否與key相同，如果相同，則返回value。咱們都知道，在 java 中，==對於物件型別引數，判斷的是引用地址，確切的說，是堆記憶體地址，所以，這裡判斷的是key的引用地址是否相同，如果相同，則返回對應的 value；如果不相同，則返回null。

原始碼如下：

public V get(Object key) {
        Object k = maskNull(key);
        Object[] tab = table;
        int len = tab.length;
        int i = hash(k, len);
        
        //迴圈遍歷陣列，直到找到key或者，陣列為空為值
        while (true) {
            Object item = tab[i];
            //通過==判斷，當前陣列元素與key相同
            if (item == k)
                return (V) tab[i + 1];
            //陣列為空
            if (item == null)
                return null;
            i = nextKeyIndex(i, len);
        }
}

3.3、remove方法

remove 的作用是通過 key 刪除對應的元素。該方法會迴圈遍歷陣列，通過==判斷是否存在key，如果有，直接將key、value設定為null，對陣列進行重新排列，返回舊 value。

原始碼如下：

public V remove(Object key) {
        Object k = maskNull(key);
        Object[] tab = table;
        int len = tab.length;
        int i = hash(k, len);

        while (true) {
            Object item = tab[i];
            if (item == k) {
                modCount++;
                //陣列長度減1
                size--;
                    V oldValue = (V) tab[i + 1];
                //將key、value設定為null
                tab[i + 1] = null;
                tab[i] = null;
                //刪除該元素後，需要把原來有衝突往後移的元素移到前面來
                closeDeletion(i);
                return oldValue;
            }
            if (item == null)
                return null;
            i = nextKeyIndex(i, len);
        }
}

closeDeletion 函式，刪除該元素後，需要把原來有衝突往後移的元素移到前面來，對陣列進行重寫排列；

private void closeDeletion(int d) {
        // Adapted from Knuth Section 6.4 Algorithm R
        Object[] tab = table;
        int len = tab.length;

        Object item;
        for (int i = nextKeyIndex(d, len); (item = tab[i]) != null;
             i = nextKeyIndex(i, len) ) {
            int r = hash(item, len);
            if ((i < r && (r <= d || d <= i)) || (r <= d && d <= i)) {
                tab[d] = item;
                tab[d + 1] = tab[i + 1];
                tab[i] = null;
                tab[i + 1] = null;
                d = i;
            }
        }
}

四、總結

IdentityHashMap 的實現不同於HashMap，雖然也是陣列，不過IdentityHashMap中沒有用到連結串列，解決衝突的方式是計算下一個有效索引，並且將資料key和value緊挨著存在map中，即table[i]=key、table[i+1]=value；
IdentityHashMap 允許key、value都為null，當key為null的時候，預設會初始化一個Object物件作為key；
IdentityHashMap在儲存、刪除、查詢資料的時候，以key為索引，通過==來判斷陣列中元素是否與key相同，本質判斷的是物件的引用地址，如果引用地址相同，那麼在插入的時候，會將value值進行替換；

IdentityHashMap 測試例子：

public static void main(String[] args) {
        Map<String, String> identityMaps = new IdentityHashMap<String, String>();

        identityMaps.put(new String("aa"), "aa");
        identityMaps.put(new String("aa"), "bb");
        identityMaps.put(new String("aa"), "cc");
        identityMaps.put(new String("aa"), "cc");
        //輸出新增的元素
        System.out.println("陣列長度："+identityMaps.size() + "，輸出結果：" + identityMaps);
    }

輸出結果：

陣列長度：4，輸出結果：{aa=aa, aa=cc, aa=bb, aa=cc}

儘管key的內容是一樣的，但是key的堆地址都不一樣，所以在插入的時候，插入了4條記錄。

五、參考

1、JDK1.7&JDK1.8 原始碼

2、簡書 - 騎著烏龜去看海 - IdentityHashMap原始碼解析

3、部落格園 - leesf - IdentityHashMap原始碼解析

作者：炸雞可樂
出處：www.pzblog.cn

相關推薦

【集合系列】- 深入淺出分析LinkedHashMap

一、摘要在集合系列的第一章，咱們瞭解到，Map的實現類有HashMap、LinkedHashMap、TreeMap、IdentityHashMap、WeakHashMap、Hashtable、Properties等等。本文主要從資料結構和演算法層面，探討LinkedHashMap的實現。二、簡介

【集合系列】- 深入淺出分析HashMap

一、摘要在集合系列的第一章，咱們瞭解到，Map的實現類有HashMap、LinkedHashMap、TreeMap、IdentityHashMap、WeakHashMap、Hashtable、Properties等等。關於HashMap，一直都是一個非常熱門的話題，只要你出去面試，我保證一定少不了它！

【集合系列】- 深入淺出分析 ArrayDeque

一、摘要在 jdk1.5 中，新增了 Queue 介面，代表一種佇列集合的實現，咱們繼續來聊聊 java 集合體系中的 Queue 介面。 Queue 介面是由大名鼎鼎的 Doug Lea 建立，中文名為道格·利，關於這位大神，會在後期進行介紹，翻開 JDK1.8 原始碼，可以將 Queue 介面旗下的

【集合系列】- 深入淺出的分析IdentityHashMap

一、摘要在集合系列的第一章，咱們瞭解到，Map 的實現類有 HashMap、LinkedHashMap、TreeMap、IdentityHashMap、WeakHashMap、Hashtable、Properties等等。應該有很多人不知道 IdentityHashMap 的存在，其中不乏工作很多年的

【集合系列】- 深入淺出的分析TreeMap

一、摘要在集合系列的第一章，咱們瞭解到，Map的實現類有HashMap、LinkedHashMap、TreeMap、IdentityHashMap、WeakHashMap、Hashtable、Properties等等。本文主要從資料結構和演算法層面，探討TreeMap的實現。二、簡介 Java T

【集合系列】- 深入淺出的分析 WeakHashMap

一、摘要在集合系列的第一章，咱們瞭解到，Map 的實現類有 HashMap、LinkedHashMap、TreeMap、IdentityHashMap、WeakHashMap、Hashtable、Properties 等等。本文主要從資料結構和演算法層面，探討 WeakHashMap 的實現。二、簡

【集合系列】- 深入淺出的分析 Hashtable

一、摘要在集合系列的第一章，咱們瞭解到，Map 的實現類有 HashMap、LinkedHashMap、TreeMap、IdentityHashMap、WeakHashMap、Hashtable、Properties 等等。本文主要從資料結構和演算法層面，探討 Hashtable 的實現，如果有理解不

【集合系列】- 深入淺出的分析 Properties

一、摘要在集合系列的第一章，咱們瞭解到，Map 的實現類有 HashMap、LinkedHashMap、TreeMap、IdentityHashMap、WeakHashMap、Hashtable、Properties 等等。在上一章節中，咱們介紹到 Hashtable 的資料結構和演算法實現，在 Ja

【集合系列】- 深入淺出的分析 Set集合

一、摘要關於 Set 介面，在實際開發中，其實很少用到，但是如果你出去面試，它可能依然是一個繞不開的話題。言歸正傳，廢話咱們也不多說了，相信使用過 Set 集合類的朋友都知道，Set集合的特點主要有：元素不重複、儲存無序的特點。啥意思呢？你可以理解為，向一個瓶子裡面扔東西，這些東西沒有記號是第幾個放

【集合系列】- 初探java集合框架圖

一、集合類簡介 Java集合就像一種容器，可以把多個物件（實際上是物件的引用，但習慣上都稱物件）“丟進”該容器中。從Java 5 增加了泛型以後，Java集合可以記住容器中物件的資料型別，使得編碼更加簡潔、健壯。 Java集合大致可以分為兩大體系，一個是Collection，另一個是Map Collec

【集合框架】JDK1.8源碼分析之HashMap（一）轉載

.get 修改 object set implement .com 功能數組元素帶來一、前言　　在分析jdk1.8後的HashMap源碼時，發現網上好多分析都是基於之前的jdk，而Java8的HashMap對之前做了較大的優化，其中最重要的一個優化就是桶中

【讀書筆記】深入淺出資料分析

目錄 · · · · · · 1 資料分析引言：分解資料 1 2 實驗：檢驗你的理論 37 3 最優化：尋找最大值 75 4 資料圖形化：圖形讓你更精明 111 5 假設檢驗：假設並非如此

【Java集合系列】總體框架

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

ArrayList集合（JDK1.8）【集合框架】JDK1.8原始碼分析之ArrayList（六）

簡述 List是繼承於Collection介面，除了Collection通用的方法以外，擴充套件了部分只屬於List的方法。常用子類？ArrayList介紹 1.資料結構其底層的資料結構是陣列，陣列元素型別為Object型別，即可以存放所

【Java集合系列】總體框架

根據上面的類圖，我們可以把java的所有集合分成三大類，其中Set集合類類似於一個糖罐子，把一個物件新增到Set集合裡面的時候，Set集合無法記住新增這個元素的順序，所以Set裡面的元素不能重複，否則系統無法準確識別這個元素；List集合非常像一個數組，她可以記住每次新增元素的順序，可以重複，只是List的長

【厚積薄發系列】C++專案總結14—Windows平臺下異常捕獲不到問題分析

問題背景：Windows平臺常用的異常捕獲函式有時候不起作用，特別是XP系統上，有些runtime error捕獲不到，但是其他系統如win7、win8等又能正常捕獲，導致產品發出去後遇到這類異常，莫名其妙的彈一個錯誤框出來導致使用者體驗特別不好。問題解決：windows平臺

【Java集合系列】---總體框架

集合--童年的美好時光集合，忽然讓小編想起那段美好的學生時光，集合第一次遇見她的時候，小編當年還是一個懵懂的丫頭，也不曾想過會在計算機的世界再次相遇，再回首，集合在數學中是一個基本概念，集合就是“一堆東

【深入學習java集合系列】LinkedHashMap的底層實現

最近寫到LeetCode上的某一題LRUCache。可以採用LinkedHashMap實現，通過重寫removeEldestEntry方法，即可實現。 LinkedHashMap map; public LRUCache(int capacity) {

【Android7.1.2原始碼解析系列】實戰分析init.rc檔案

實戰分析init.rc檔案前言：經過上一篇的/system/core/init/readme.txt檔案的翻譯，對於init.rc的語法也有了一定的瞭解，這一篇就對/system/core/rootdir/init.rc檔案進行一個分析，希望能夠藉此對android的開

【集合框架】之深入分析HashMap

提出並解決問題如下：問題1：初始容量為什麼是16，為什麼必須是2的冪？問題2： hash方法為什麼是無符號右移16位？問題3：問題4：問題5： HashMap 非執行緒安全繼承於AbstractMap 實現了Map、Clon