對HashMap的思考及手寫實現
前言HashMap是Java中常用的集合,而且HashMap的一些思想,對於我們平時解決業務上的一些問題,在思路上有幫助,基於此,本篇部落格將分析HashMap底層設計思想,並手寫一個迷你版的HashMap!
對HashMap的思考
HashMap底層資料結構
第一,如圖所示,HashMap有3個要素:hash函式+陣列+單鏈表
第二,對於hash函式而言,需要考慮些什麼?
要快,對於給定的Key,要能夠快速計算出在陣列中的index。那麼什麼運算夠快呢?顯然是位運算!
要均勻分佈,要較少碰撞。說白了,我們希望通過hash函式,讓資料均勻分佈在陣列中,不希望大量資料發生碰撞,導致連結串列過長。那麼怎麼辦到呢?也是利用位運算,通過對資料的二進位制的位進行移動,讓hash函式得到的資料雜湊開來,從而減低了碰撞的概率。
如果發生了碰撞怎麼辦?上面的圖其實已經說明了JDK的HashMap是如何處理hash衝突的,就是通過單鏈表解決的。那麼除了這個方法,還有其他思路麼?比如說,如果發生衝突,那麼記下這個衝突的位置為index,然後在加上固定步長,即index+step,找到這個位置,看一下是否仍然衝突,如果繼續衝突,那麼按照這個思路,繼續加上固定步長。其實這就是所謂的線性探測來解決Hash衝突的方法!
通過寫一個迷你版的HashMap來深刻理解定義介面
介面定義一個介面,對外暴露快速存取的方法。
注意MyMap介面內部定義了一個內部介面Entry。
介面實現
MyHashMap定義HashMap的要素之一,就是陣列,自然在這裡,我們要定義陣列,陣列的初始化大小,還要考慮擴容的閥值。
看MyHashMap的構造
構造方法構造方法有什麼好說的呢?
仔細觀察下,你會發現,其實這裡使用到了“門面模式”。這裡的2個構造方法其實指向的是同一個,但是對外卻暴露了2個“門面”!
Entry
EntryHashMap的要素之一,單鏈表的體現就在這裡!
看put如何實現
put第一,要考慮是否擴容?
HashMap中的Entry的數量(陣列以及單鏈表中的所有Entry)是否達到閥值?
第二,如果擴容,意味著新生成一個Entry[],不僅如此還得重新雜湊。
第三,要根據Key計算出在Entry[]中的位置,定位後,如果Entry[]中的元素為null,那麼可以放入其中,如果不為空,那麼得遍歷單鏈表,要麼更新value,要麼形成一個新的Entry“擠壓”單鏈表!
hash函式
MyHashMap提供的hash函式
JDK的HashMap提供的hash函式我這裡參考了JDK的HashMap的hash函式的實現,這裡也再次說明了:要想雜湊均勻,就得進行二進位制的位運算!
resize和rehash
resize/rehash這裡可以看出,對於HashMap而言,如果頻繁進行resize/rehash操作,是會影響效能的。
resize/rehash的過程,就是陣列變大,原來陣列中的entry元素一個個的put到新陣列的過程,需要注意的是一些狀態變數的改變。
get實現
getget很簡單,只需要注意在遍歷單鏈表的過程中使用== or equals來判斷下即可。
Test測試
利用MyHashMap進行存取執行結果
result
OK,一個迷你版的HashMap就寫好了,你學到了麼?