HashMap中的hash演算法中的幾個疑問

阿新 • • 發佈：2019-07-18

HashMap中雜湊演算法的關鍵程式碼

//重新計算雜湊值
static final int hash(Object key) {
    int h;
    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);//key如果是null 新hashcode是0 否則 計算新的hashcode
}

//計算陣列槽位
 (n - 1) & hash

HashMap的細節我們不談，只看這個雜湊演算法的細節(h = key.hashCode()) ^ (h >>> 16)

^按位異或運算，只要位不同結果為1，不然結果為0；
>>> 無符號右移：右邊補0

為什麼要無符號右移16位後做異或運算

根據上面的說明我們做一個簡單演練

將h無符號右移16為相當於將高區16位移動到了低區的16位，再與原hashcode做異或運算，可以將高低位二進位制特徵混合起來

從上文可知高區的16位與原hashcode相比沒有發生變化，低區的16位發生了變化

我們可知通過上面(h = key.hashCode()) ^ (h >>> 16)進行運算可以把高區與低區的二進位制特徵混合到低區，那麼為什麼要這麼做呢？

我們都知道重新計算出的新雜湊值在後面將會參與hashmap中陣列槽位的計算，計算公式：(n - 1) & hash，假如這時陣列槽位有16個，則槽位計算如下：

仔細觀察上文不難發現，高區的16位很有可能會被陣列槽位數的二進位制碼鎖遮蔽，如果我們不做剛才移位異或運算，那麼在計算槽位時將丟失高區特徵

也許你可能會說，即使丟失了高區特徵不同hashcode也可以計算出不同的槽位來，但是細想當兩個雜湊碼很接近時，那麼這高區的一點點差異就可能導致一次雜湊碰撞，所以這也是將效能做到極致的一種體現

使用異或運算的原因

異或運算能更好的保留各部分的特徵，如果採用&運算計算出來的值會向1靠攏，採用|運算計算出來的值會向0靠攏

為什麼槽位數必須使用2^n

1、為了讓雜湊後的結果更加均勻

這個原因我們繼續用上面的例子來說明

假如槽位數不是16，而是17，則槽位計算公式變成：(17 - 1) & hash

從上文可以看出，計算結果將會大大趨同，hashcode參加&運算後被更多位的0遮蔽，計算結果只剩下兩種0和16，這對於hashmap來說是一種災難

2、可以通過位運算e.hash & (newCap - 1)來計算，a % (2^n) 等價於 a & (2^n - 1) ，位運算的運算效率高於算術運算，原因是算術運算還是會被轉化為位運算

說了這麼多點，上面提到的所有問題，最終目的還是為了讓雜湊後的結果更均勻的分部，減少雜湊碰撞，提升hashmap的執行效率

HashMap中的hash演算法中的幾個疑問

HashMap中雜湊演算法的關鍵程式碼 //重新計算雜湊值 static final int hash(Object key) { int h; return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16

拓撲學中凝聚點的幾個等價定義

alt number 地址 ges .cn 自然數 ref 一個 lan 下載地址: http://jour.duxiu.com/JourDetail.jsp?dxNumber=100244108007&d=299CE906C4AF5AB611BA41DF81224

yii2.0 中刪除滿足某幾個條件的全部數據

lis variable 全部 let spa user 數據 ble not in 刪除user表中的type=2 and usercategoryid 不是1，2。3的全部數據User::deleteAll([ ‘and‘, ‘type = :type_id‘, [‘n

java 中一個char包含幾個字節

導致 sdn col 會有 2個 tar 防止 clas 記得背景 ??char包含幾個字節可能記得在上學的時候書上寫的是2個字節，一直沒有深究，今天我們來探究一下到底一個char多少個字節? Char ??char在設計之初的時候被用來存儲字符，可是世界上有那麽多字符，

讓一個元素在容器中垂直居中的幾個方法

body 垂直居中 -s ntb offset set log off htm 方法一，使用js讓元素水平垂直居中 <!DOCTYPE html> <html> <head> <meta charset

linux中關於賬戶的幾個特殊的目錄

用戶賬戶的解析庫和認證庫的一些linux中關於賬戶的幾個特殊的目錄以下介紹的幾個特殊的目錄，都是對文件權限操作的特殊目錄。我在下一篇介紹文件權限，這一片介紹這幾個關於用戶賬戶和組賬戶有關的目錄。與用戶賬戶和組賬戶相關的文件： /etc/passwd（用戶賬戶解析庫） /etc/group（組賬戶解

ARM 中必須明白的幾個概念

調制 sys cti boot exti dmi 遇到程序通過文章具體介紹了關於ARM的22個常用概念。 1.ARM中一些常見英文縮寫解釋　　MSB：最高有效位；　　LSB：最低有效位；　　AHB：先進的高性能總線；　　VPB：連接片內外設功能的V

python中列表常用的幾個操作函數

添加序列原函數 PE odi final date 用法 extend # coding=utf-8#在列表末尾添加新的對像#實例展現函數append()的用法aList=[456,‘abc‘,‘zara‘,‘ijk‘,2018]aList.append(123)pri

Spirng中的@Scope的幾個作用域

今天面試時面試官問到了我這個問題，當時不知如何回答，回家研究了一下scope的作用域。預設是單例模式，即scope="singleton"。另外scope還有prototype、request、session、global session作用域。scope="prototype"多例。再配置be

Ｃ程式碼中向量運算的幾個例子

　　最近遇到了一個Ｃ語言中使用向量運算的問題，栽了不少跟頭，這裡就做個總結，免得後面再犯類似錯誤．　　該資料結構的定義如下所示： typedef int v4si __attribute__ ((vector_size (16))) 　　基本的操作： typedef int v4si

Python中使用字典的幾個小技巧

讀取只需要管理解包領取意思創建小技巧其它 1 解包所謂解包，就是將字典通過 ** 操作符轉為 Key=Value 的形式，這種形式可以直接傳給函數作為關鍵字參數。說說適用的幾種情況。 1.1 搜索拼接條件當應用中使用類似 SQLAlchemy 的 OR

STM32的HAL庫中的DMA_FLAG_TCIF3_7等幾個巨集定義的含義

DMA_FLAG_TCIF0_4就是指DMA的通道0和通道4，DMA_FLAG_TCIF1_5就是指DMA的通道1和通道5，DMA_FLAG_TCIF2_6就是指DMA的通道2和通道6，DMA_FLAG_TCIF3_7就是指DMA的通道3和通道7。所以在STM32F429中，使用DMA進行串列埠傳送的時候

Spark 中的 RPC 的幾個類

Spark 中 RPC 部分的涉及了幾個類，有點暈，在此記錄一下 1. RpcEndpoint： RPC的一個端點。給定了相應訊息的觸發函式。保證 `onStart`, `receive` and `onStop` 函式按順序觸發。 2. RpcEndpointRef：一個遠端的 RpcEn

HDFS讀寫檔案中涉及到的幾個思想

HDFS讀寫檔案中涉及到的幾個思想 1.網路拓撲--節點距離計算 2.機架感知（副本節點選擇） 1.網路拓撲–節點距離計算 1.節點距離：兩個節點到達最近的共同祖先的距離總和。 2.圖解： 2.機架感知（副本節點選擇） 1.官方說明

js向一個數組中插入元素的幾個方法-效能比較

向一個數組中插入元素是平時很常見的一件事情。你可以使用push在陣列尾部插入元素,可以用unshift在陣列頭部插入元素,也可以用splice在陣列中間插入元素。但是這些已知的方法，並不意味著沒有更加高效的方法。讓我們接著往下看…… 向陣列結尾新增元素向陣列結尾新增元素用push()

功能測試中要注意的幾個細節（學習筆記）

UI測試： 1、導航測試：不同連線頁面的跳轉，如返回鍵，進入鍵設計是否直觀，是否符合操作習慣 2、關於搜尋：是否在當前頁面進行輸入，刪除搜尋關鍵字後頁面是否變化，觸發搜尋的按鈕，螢幕圖示是否可點，或者是否有搜尋鍵（有些app需要使用鍵盤上的搜尋鍵） 3、圖形測試

Adobe Animate中必須掌握的幾個要點

Adobe Animate脫胎於Flash編輯器，這個由MacroMedia公司原創的flash曾經風靡一時，後面更是在Abode收購後大放異彩，甚至都出現了以此為生的“閃客”的出現，但其安全漏洞成了其難以隔去的闌尾，實際上是屢次更新也無法徹底解決，像蘋果、谷歌、微軟這樣的主流廠商，很早

前端---js中在製作頁面中比較常用的幾個css屬性

今天在這裡給大家總結幾個我在製作一個頁面時所用到的一些不太常用的屬性,但有時候使用這些屬效能增加頁面的可觀性以及減少其他複雜的操作使用. z-index屬性 z-index 屬性設定元素的堆疊順序。擁有更高堆疊順序的元素總是會處於堆疊順序較低的元素的前面。該屬性設定一個定位元素沿

區域網搭建中經常遇到的幾個問題

　　1、如何正確選擇佈線材質—聚氯乙烯材質(PVC)和阻燃、低煙、無毒材質(LSFRZH)? 　　目前，我國人民對環境保護越來越重視，對自身生存環境的質量要求也越來越高，但是，生活質量的基本前提是生存的安全性。許多人還沒有意識到正確選擇網路佈線系統中的材料，以便在危機發生的時候能夠最大限度地保護人的安全可靠

面試中常考的幾個集合類（java）

這裡首先借用下網上的一張集合介面關係圖下面簡述幾種常用集合的區別，還有部分不常用集合類未描述 Iterable迭代器介面，這是Collection類的父介面。實現這個Iterable介面的物件允許使用foreach進行遍歷，也就是說，所有的Collection集合物件都

HashMap中的hash演算法中的幾個疑問

HashMap中雜湊演算法的關鍵程式碼

為什麼要無符號右移16位後做異或運算

使用異或運算的原因

為什麼槽位數必須使用2^n

相關推薦