ArrayMap是如何提高記憶體的使用效率的？

阿新 • • 發佈：2018-11-12

ArraySet使用陣列儲存資料，提高了記憶體的使用效率，在資料量不超過1000時，相較於HashSet，效率最多不會降低50%，本節來分析下ArraySet 新增和刪除元素分析，谷歌指出ArrayMap的設計也是為了更加高效地使用記憶體，在資料量不超過1000時，效率最多不會降低50%。閱讀原碼可以發現，ArrayMap和ArraySet在實現上保持了統一，主要的不同是元素的儲存方式。

繼承結構

可以看到，```ArrayMap```的繼承結構比較簡單，只是實現了Map介面。

儲存結構

可以回憶一下ArraySet的儲存結構：一個int型別的陣列mHashes儲存hash值，一個object型別的陣列mArray儲存內容，這兩個陣列的下標一一對應。

ArrayMap的儲存結構猜想應該和ArraySet不一樣，因為ArrayMap不僅僅需要儲存value，還需要儲存key，Google的大神們是怎樣解決這個問題的呢？

Google的大神們還是使用了和ArraySet一樣的資料結構，在儲存key和value時設計了一個非常巧妙的方法。

如上圖所示，```mHashes```中儲存了```key```的hash值，```key```在```mHashes```的下標為```index```，在```mArray```中，```mArray[index<<1]```儲存```key```，```mArray[index<<1 + 1]```儲存```value```。故```mArray```的長度是```mHashes```的2倍。這樣的設計使的```ArraySet```和```ArrayMap```在儲存結構上保持了統一。

新增和刪除

ArraySet和ArrayMap在實現上保持了統一，閱讀原碼可以發現，他們擁有同樣的快取結構，刪除和新增元素時會有相同的邏輯流程。大致看下HashMap的儲存結構

上圖是 HashMap的儲存結構，每個連結串列後面的元素的數量沒有達到將連結串列樹化的數目。 HashMap在儲存k-v鍵值對的時候，首先根據k的hash值找到k-v儲存的連結串列陣列的下標，然後將k-v鍵值對儲存在連結串列的最後。 ArrayMap使用兩個一維陣列分別儲存k的hash值和k-v鍵值對。新增元素時根據k查詢元素以確認元素是否已經存在，如果已經存在則直接更新，否則新增；刪除元素時查詢元素以確定元素是否存在，如果不存在則直接返回，否則刪除元素。 ArrayMap

在新增刪除元素的過程中，也會涉及到元素的移動，快取的新增和刪除。整個流程和 ArraySet相同。但是需要注意的是， ArrayMap在新增和刪除元素的過程中，儲存k-v鍵值對 mArray陣列需要同時修改k和v兩個元素。

元素查詢

經過上面的分析，可能發現了一個問題，ArrayMap和ArraySet太相似了。確實是，他們在底層儲存結構，快取結構都是一樣的。新增和刪除元素的時候，需要查詢元素，新增元素時根據k查詢元素以確認元素是否已經存在，如果已經存在則直接更新，否則新增；刪除元素時查詢元素以確定元素是否存在，如果不存在則直接返回，否則刪除元素。ArrayMap是否和ArraySet具有相同的查詢過程呢。直接上原始碼：

    int indexOf(Object key, int hash) {
        final int N = mSize;

        // Important fast case: if nothing is in here, nothing to look for.
        if (N == 0) {
            return ~0;
        }

        int index = binarySearchHashes(mHashes, N, hash);

        // If the hash code wasn't found, then we have no entry for this key.
        if (index < 0) {
            return index;
        }

        // If the key at the returned index matches, that's what we want.
        if (key.equals(mArray[index<<1])) {
            return index;
        }

        // Search for a matching key after the index.
        int end;
        for (end = index + 1; end < N && mHashes[end] == hash; end++) {
            if (key.equals(mArray[end << 1])) return end;
        }

        // Search for a matching key before the index.
        for (int i = index - 1; i >= 0 && mHashes[i] == hash; i--) {
            if (key.equals(mArray[i << 1])) return i;
        }

        // Key not found -- return negative value indicating where a
        // new entry for this key should go.  We use the end of the
        // hash chain to reduce the number of array entries that will
        // need to be copied when inserting.
        return ~end;
    }
    
    
    private static int binarySearchHashes(int[] hashes, int N, int hash) {
        try {
            return ContainerHelpers.binarySearch(hashes, N, hash);
        } catch (ArrayIndexOutOfBoundsException e) {
            if (CONCURRENT_MODIFICATION_EXCEPTIONS) {
                throw new ConcurrentModificationException();
            } else {
                throw e; // the cache is poisoned at this point, there's not much we can do
            }
        }
    }
複製程式碼

以上為indexOf函式和binarySearchHashes函式的實現。通過對比原始碼，可以發現，ArrayMap和ArraySet使用了相同的二分查詢邏輯，可以肯定的，和ArraySet一樣，ArrayMap在儲存hash值時是有序的。具體的查詢過程的分析可以參考ArraySet 新增和刪除元素分析

不同點

上面的分析容易讓人產生一種感覺ArraySet和ArrayMap的實現完全相同。這是一種誤解，ArraySet和ArrayMap在實現的邏輯流程是相同的，但在細節處理上還是有不同。新增刪除元素的過程中，不同點主要體現在在新增和刪除元素的過程中，如果有其他操作改變了ArrayMap儲存的內容的數量，則會丟擲ConcurrentModificationException，ArrayMap中能改變儲存容量的是以下三個方法：put、remove、clear

可以做一個小實驗首先，兩個執行緒同時修改ArrayMap同一個key下的value

ArrayMap<String, String> aMap = new ArrayMap<>();
	aMap.put("key", "value");
	new Thread(new Runnable() {
		
		@Override
		public void run() {
			// TODO Auto-generated method stub
			for (int i = 0 ; ; i++) {
				aMap.put("key", "value" + i);
			}
		}
	}).start();
	
	new Thread(new Runnable() {
		
		@Override
		public void run() {
			// TODO Auto-generated method stub
			for (int i = 0 ; ; i++) {
				aMap.put("key", "value" + i);
			}
		}
	}).start();
複製程式碼

執行後可以發現，程式會一直執行，也不會報錯。

接下來看下兩個執行緒同時向ArrayMap中新增元素

ArrayMap<String, String> aMap = new ArrayMap<>();
	new Thread(new Runnable() {
		
		@Override
		public void run() {
			// TODO Auto-generated method stub
			for (int i = 0 ; ; i++) {
				aMap.put("key" + i, "value" + i);
			}
		}
	}).start();
	
	new Thread(new Runnable() {
		
		@Override
		public void run() {
			// TODO Auto-generated method stub
			for (int i = 0 ; ; i++) {
				aMap.put("key" + i, "value" + i);
			}
		}
	}).start();
複製程式碼

執行程式後，會報如下異常

Exception in thread "Thread-1" java.util.ConcurrentModificationException
at com.rock.collections.array.ArrayMap.put(ArrayMap.java:527)
at com.rock.collections.Client$2.run(Client.java:50)
at java.lang.Thread.run(Thread.java:748)
複製程式碼

（我將ArrayMap抽出來進行測試，故顯示的包名是我自定義的）可以發現由於兩個執行緒同時向aMap中添加了元素，修改了元素的數量，系統丟擲了ConcurrentModificationException。

跟蹤下新增元素的過程

 @Override
public V put(K key, V value) {
    final int osize = mSize;
    ......
    index = ~index;
    if (osize >= mHashes.length) {
        // 陣列擴容
        final int n = osize >= (BASE_SIZE*2) ? (osize+(osize>>1))
                : (osize >= BASE_SIZE ? (BASE_SIZE*2) : BASE_SIZE);

        ......
        allocArrays(n);

        if (CONCURRENT_MODIFICATION_EXCEPTIONS && osize != mSize) {
            throw new ConcurrentModificationException();
        }
        ......
    }

    ......

    if (CONCURRENT_MODIFICATION_EXCEPTIONS) {
        if (osize != mSize || index >= mHashes.length) {
            throw new ConcurrentModificationException();
        }
    }
    mHashes[index] = hash;
    mArray[index<<1] = key;
    mArray[(index<<1)+1] = value;
    mSize++;
    return null;
}
複製程式碼

原始碼已經很清晰了，CONCURRENT_MODIFICATION_EXCEPTIONS = true，在新增元素之前，使用osize記錄mSize，在擴容之後和最後新增元素之前會對當前元素的數量進行判斷，如果發生了變化則丟擲異常。

再跟蹤下刪除元素的過程

public V removeAt(int index) {
    final int osize = mSize;
    ......
    if (osize <= 1) {
        ......
    } else {
        nsize = osize - 1;
        if (mHashes.length > (BASE_SIZE*2) && mSize < mHashes.length/3) {
            ......

            if (CONCURRENT_MODIFICATION_EXCEPTIONS && osize != mSize) {
                throw new ConcurrentModificationException();
            }

            ......
        } else {
            ......
        }
    }
    if (CONCURRENT_MODIFICATION_EXCEPTIONS && osize != mSize) {
        throw new ConcurrentModificationException();
    }
    mSize = nsize;
    return (V)old;
}
複製程式碼

在縮容或者記錄最終元素的數量之前，如果發現元素的數量被修改過，則丟擲異常。這個地方還有一個要注意的，由於是刪除元素，mSize最終是要發生變化的，但是原始碼中對比的mSize發生變化之前的值。

小結

ArrayMap的設計是為了更加高效地利用記憶體，高效體現在以下幾點

ArrayMap使用更少的儲存單元儲存元素 ArrayMap使用int型別的陣列儲存hash，使用Object型別陣列儲存k-v鍵值對，相較於HashMap使用Node儲存節點，ArrayMap儲存一個元素佔用的記憶體更小。
ArrayMap在擴容時容量變化更小 HashMap在擴容的時候，通常會將容量擴大一倍，而ArrayMap在擴容的時候，如果元素個數超過8，最多擴大自己的1/2。

雖然有以上有點，但是和ArraySet一樣，ArrayMap也存在以下劣勢：

儲存大量（超過1000）元素時比較耗時
在對元素進行查詢或者確定待插入元素的位置時使用二分查詢，當元素較多時，耗時較長
頻繁擴容和縮容，可能會產生大量複製操作
ArrayMap在擴容和縮容時需要移動元素，且擴容時容量變化比HashMap小，擴容和縮容的頻率可能更高，元素數量過多時，元素的移動可能會對效能產生影響。

基於以上優缺點，google給出的建議是當元素數量小於1000時，建議使用Array代替HashMap，效率降低最多不會超過50%

ArrayMap是如何提高記憶體的使用效率的？

繼承結構

儲存結構

新增和刪除

元素查詢

不同點

小結

關注微信公眾號，最新技術乾貨實時推送

ArrayMap是如何提高記憶體的使用效率的？

for迴圈提高記憶體訪問效率的做法

[菜鳥每天來段CUDA_C] 利用頁鎖定記憶體提高運算效率

充分利用CPU快取記憶體，提高程式效率（原理篇）

減少與數據庫的連接，提高請求效率

index seek和index scan 提高sql 效率

光環國際PMP：項目經理提高工作效率的方法

提高辦公效率的軟件

Android Stuido 提高開發效率的插件

能夠提高開發效率的Eclipse實用操作

如何運用GitHub來提高生產效率

Hosts文件實際應用配置內部服務器提高訪問效率和速度

oracle分區技術提高查詢效率

輕松提高學習效率的思維導圖記憶法

iOS-構建自己的代碼塊【提高編碼效率-Xcode代碼塊】

幹貨 | 碼農翻身提高工作效率的必備工具

Linux系統提高編輯效率的vim工具重要知識

提高工作效率的軟件推薦

提高工作效率的小技巧

模擬web請求——簡單的小程序提高工作效率

ArrayMap是如何提高記憶體的使用效率的？

繼承結構

儲存結構

新增和刪除

元素查詢

不同點

小結

關注微信公眾號，最新技術乾貨實時推送

相關推薦