雜湊表中線性探測再雜湊法及等概率條件下平均查詢長度
最近複習了下資料結構中的雜湊表,發現在計算等概率情況下查詢不成功的平均查詢長度時比較迷茫,不知道到底是怎麼計算出來的。現在通過查閱資料終於知道如何計算了,所以記錄下來以供以後查閱。
下面看下2010年2010年全國碩士研究生入學統一考試電腦科學與技術學科聯考計算機學科專業基礎綜合試題中一個考雜湊表的題。
Question1:
將關鍵字序列(7、8、30、11、18、9、14)雜湊儲存到散列表中。散列表的儲存空間是一個下標從0開始的一維陣列,雜湊函式為: H(key) = (keyx3) MOD 7,處理衝突採用線性探測再雜湊法,要求裝填(載)因子為0.7。
(1) 請畫出所構造的散列表。
(2) 分別計算等概率情況下查詢成功和查詢不成功的平均查詢長度。
Ans:
(1).首先明確一個概念裝載因子,裝載因子是指所有關鍵子填充雜湊表後飽和的程度,它等於 關鍵字總數/雜湊表的長度。 根據題意,我們可以確定雜湊表的長度為 L = 7/0.7 = 10;因此此題需要構建的雜湊表是下標為0~9的一維陣列。根據雜湊函式可以得到如下雜湊函式值表。
H(Key) = (keyx3) MOD 7, 例如key=7時, H(7) = (7x3)%7 = 21%7=0,其他關鍵字同理。
Key | 7 | 8 | 30 | 11 | 18 | 9 | 14 |
H(Key) | 0 | 3 | 6 | 5 | 5 | 6 | 0 |
(表1)
採用線性探測再雜湊法處理衝突,所構造的散列表為:
地址 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
關鍵字 | 7 | 14 | 8 | 11 | 30 | 18 | 9 |
(表2)
下面對散列表的構造方式加以說明,注意表1中的關鍵字7和14,30和9, 11和18,這三組關鍵子的H(Key)值相同,這在構建散列表時就會產生衝突,因為他們的地址相同,所以要通過一定的衝突處理方法來解決這個問題。依題,採用線性探測再雜湊法處理衝突。下面詳細介紹如何構建散列表:
第一個key 7,它的地址是0,因此放到散列表的陣列下表為0的位置,這個位置上沒有關鍵字,因此沒有衝突可以直接填入;
第二個key 8,它的地址是3,因此放到散列表的陣列下表為3的位置,這個位置上沒有關鍵字,因此沒有衝突可以直接填入;
第三個key 30,它的地址是6,因此放到散列表的陣列下表為6的位置,這個位置上沒有關鍵字,因此沒有衝突可以直接填入;
第四個key 11,它的地址是5,因此放到散列表的陣列下表為5的位置,這個位置上沒有關鍵字,因此沒有衝突可以直接填入;
第五個key 18,它的地址是5,因此放到散列表的陣列下表為5的位置,但這個位置上已經有關鍵字11,遇到了衝突,此時我們根據線性探測再雜湊法來處理這個衝突,探測下一個位置6, 6這個位置上已經存在關鍵字30則繼續增加步長1,因此現在的新地址應為7,位置7上沒有關鍵字,放入即可,到此衝突已經解決;
第六個key 9,它的地址是6,因此放到散列表的陣列下表為6的位置,但這個位置上已經有關鍵字30,遇到了衝突,探測下一個位置7, 7這個位置上已經存在關鍵字18則繼續增加步長1,因此現在的新地址應為8,位置8上沒有關鍵字,放入即可;
第七個key 14,它的地址是0,因此放到散列表的陣列下表為0的位置,但這個位置上已經有關鍵字7,遇到了衝突,探測下一個位置1, 位置1上沒有關鍵字,放入即可;
到這一步所有關鍵字均已填入,散列表已經構造完成,如表2所示。
(2)等概率情況下查詢成功平均查詢長度:
這一問可以根據第一問的構造過程求解:
key7一次就填入了表中,因此查詢次數為1,同理8, 30, 11查詢次數均為1; key18 進行了3次放入操作,探測位置分別是5,6,7 ,因此查詢次數為3;key9也是3次;key14 進行了兩次探測,因此查詢次數為2。次數表如表3所示
Key | 7 | 8 | 30 | 11 | 18 | 9 | 14 |
Count | 1 | 1 | 1 | 1 | 3 | 3 | 2 |
(表3)
所以ASLsuccess= (1+1+1+1+3+3+2)/ 7 = 12/7。
等概率情況下查詢不成功的平均查詢長度:
接下來討論不成功的情況, 看錶2,計算查詢不成功的次數就直接找關鍵字到第一個地址上關鍵字為空的距離即可, 但根據雜湊函式地址為MOD7,因此初始只可能在0~6的位置。等概率情況下,查詢0~6位置查詢失敗的查詢次數為:
看地址0,到第一個關鍵字為空的地址2的距離為3,因此查詢不成功的次數為3.
地址1, 到第一個關鍵為空的地址2的距離為2,因此查詢不成功的次數為2.
地址2, 到第一個關鍵為空的地址2的距離為1,因此查詢不成功的次數為1.
地址3,到第一個關鍵為空的地址4的距離為2,因此查詢不成功的次數為2.
地址4,到第一個關鍵為空的地址4的距離為1,因此查詢不成功的次數為1.
地址5,到第一個關鍵為空的地址2(注意不是地址9,因為初始只可能在0~6之間,因此迴圈回去)的距離為5,因此查詢不成功的次數為5.
地址6,到第一個關鍵為空的地址2(注意不是地址9,因為初始只可能在0~6之間,因此迴圈回去)的距離為4,因此查詢不成功的次數為4.
因此查詢不成功的次數表如下表所示
Key | 7 | 8 | 30 | 11 | 18 | 9 | 14 |
Count | 3 | 2 | 1 | 2 | 1 | 5 | 4 |
所以ASLunsuccess= (3+2+1+2+1+5+4)/ 7 = 18/7。
以上表述如有不對的地方,歡迎大家指正。謝謝。。。