1. 程式人生 > >對HashMap的思考及手寫實現

對HashMap的思考及手寫實現

前言HashMap是Java中常用的集合,而且HashMap的一些思想,對於我們平時解決業務上的一些問題,在思路上有幫助,基於此,本篇部落格將分析HashMap底層設計思想,並手寫一個迷你版的HashMap!

對HashMap的思考

clipboard.png

HashMap底層資料結構

第一,如圖所示,HashMap有3個要素:hash函式+陣列+單鏈表

第二,對於hash函式而言,需要考慮些什麼?

要快,對於給定的Key,要能夠快速計算出在陣列中的index。那麼什麼運算夠快呢?顯然是位運算!

要均勻分佈,要較少碰撞。說白了,我們希望通過hash函式,讓資料均勻分佈在陣列中,不希望大量資料發生碰撞,導致連結串列過長。那麼怎麼辦到呢?也是利用位運算,通過對資料的二進位制的位進行移動,讓hash函式得到的資料雜湊開來,從而減低了碰撞的概率。

如果發生了碰撞怎麼辦?上面的圖其實已經說明了JDK的HashMap是如何處理hash衝突的,就是通過單鏈表解決的。那麼除了這個方法,還有其他思路麼?比如說,如果發生衝突,那麼記下這個衝突的位置為index,然後在加上固定步長,即index+step,找到這個位置,看一下是否仍然衝突,如果繼續衝突,那麼按照這個思路,繼續加上固定步長。其實這就是所謂的線性探測來解決Hash衝突的方法!

通過寫一個迷你版的HashMap來深刻理解定義介面

clipboard.png

介面定義一個介面,對外暴露快速存取的方法。

注意MyMap介面內部定義了一個內部介面Entry。

介面實現

clipboard.png

MyHashMap定義HashMap的要素之一,就是陣列,自然在這裡,我們要定義陣列,陣列的初始化大小,還要考慮擴容的閥值。

看MyHashMap的構造

clipboard.png

構造方法構造方法有什麼好說的呢?

仔細觀察下,你會發現,其實這裡使用到了“門面模式”。這裡的2個構造方法其實指向的是同一個,但是對外卻暴露了2個“門面”!

Entry

clipboard.png

EntryHashMap的要素之一,單鏈表的體現就在這裡!

看put如何實現

clipboard.png

put第一,要考慮是否擴容?

HashMap中的Entry的數量(陣列以及單鏈表中的所有Entry)是否達到閥值?

第二,如果擴容,意味著新生成一個Entry[],不僅如此還得重新雜湊。

第三,要根據Key計算出在Entry[]中的位置,定位後,如果Entry[]中的元素為null,那麼可以放入其中,如果不為空,那麼得遍歷單鏈表,要麼更新value,要麼形成一個新的Entry“擠壓”單鏈表!

hash函式

clipboard.png

MyHashMap提供的hash函式

clipboard.png

JDK的HashMap提供的hash函式我這裡參考了JDK的HashMap的hash函式的實現,這裡也再次說明了:要想雜湊均勻,就得進行二進位制的位運算!

resize和rehash

clipboard.png

resize/rehash這裡可以看出,對於HashMap而言,如果頻繁進行resize/rehash操作,是會影響效能的。

resize/rehash的過程,就是陣列變大,原來陣列中的entry元素一個個的put到新陣列的過程,需要注意的是一些狀態變數的改變。

get實現

clipboard.png

getget很簡單,只需要注意在遍歷單鏈表的過程中使用== or equals來判斷下即可。

Test測試

clipboard.png

利用MyHashMap進行存取執行結果

clipboard.png

result

OK,一個迷你版的HashMap就寫好了,你學到了麼?