知道為啥HashMap裡面的陣列size必須是2的次冪？

阿新 • • 發佈：2019-02-08

最近在寫一個簡易的分離鎖的類:

要求：對不同的Key進行hash得到一個Lock，並要求對鎖對映的概率差不多。比如，160個Key，分佈到16個鎖上，大概有10個Key是對映到同一個鎖上的，只要這樣併發效率才會高。

Java程式碼

public class SplitReentrantLock {
private Lock[] locks;
private int LOCK_NUM;
public SplitReentrantLock(int lockNum) {
super();
LOCK_NUM = lockNum;
locks = new Lock[LOCK_NUM];
for (int i = 0; i < LOCK_NUM; i++) {
locks[i] = new ReentrantLock();
}
}
/**
* 獲取鎖, 使用HashMap的hash演算法
*
*
* @param key
* @return
*/
public Lock getLock(String key) {
int

lockIndex = index(key);
return locks[lockIndex];
}
int index(String key) {
int hash = hash(key.hashCode());
return hash & (LOCK_NUM - 1);
}
int hash(int h) {
h ^= (h >>> 20) ^ (h >>> 12);
return h ^ (h >>> 7

) ^ (h >>> 4);
}

用法：

Java程式碼

SplitReentrantLock locks = new SplitReentrantLock(16);
Lock lock =locks.getLock(key);
lock.lock();
try{
//......
}finally{
lock.unlock();
}

本來認為用HashMap的hash演算法就能夠將達到上述的要求，結果測試的時候嚇了一跳。

測試程式碼：

Java程式碼

public class SplitReenterLockTest extends TestCase {
public void method(int lockNum, int testNum) {
SplitReentrantLock splitLock = new SplitReentrantLock(lockNum);
Map<Integer, Integer> map = new TreeMap<Integer, Integer>();
for (int i = 0; i < lockNum; i++) {
map.put(i, 0);
}
for (int i = 0; i < testNum; i++) {
Integer key = splitLock.index(RandomStringUtils.random(128));
map.put(key, map.get(key) + 1);
}
for (Map.Entry<Integer, Integer> entry : map.entrySet()) {
System.out.println(entry.getKey() + " : " + entry.getValue());
}
}
public void test1() {
method(50, 1000);}
}

結果：1000個隨機key的hash只是對映到8個 Lock上，而不是平均到50個Lock上。

而且是固定分佈到0,1,16,17,32,33,48,49的陣列下標對應的Lock上面，這是為什麼呢？

如果改為：

Java程式碼

public void test1() {
method(32, 1000);
}

結果：1000個隨機key的hash 對映到32個Lock上，而且基本上是平均分佈的。

問題：為什麼50和32的hash的效果差別那麼大呢？

再次測試2,4,8,16,64,128. 發現基本上都是平均分佈到所有的Lock上面。

得到平均分佈的這些數都是2的次冪，難道hash演算法和二進位制有關？

看看hash演算法：

Java程式碼

int index(String key) {
int hash = hash(key.hashCode());
return hash & (LOCK_NUM - 1);
}
int hash(int h) {
h ^= (h >>> 20) ^ (h >>> 12);
return h ^ (h >>> 7) ^ (h >>> 4);
}

先是經過神奇的(ps：不知道為什麼這麼運算，無知的我只能用神奇來形容)的位運算，最後和LOCK_NUM - 1來進行與運算。

本帖的關鍵點就是在於這個與運算中，如果要想運算後的結果是否平均分佈，在於LOCK_NUM-1的二進位制中1的位數有幾個。如果都是1,那麼肯定是平均分佈到0至LOCK_NUM-1上面。否則僅僅分佈指定的幾位。

下面以50和32說明：

假設Key進行hash執行得到hash值為h,

比如：我測試的資料中的一些h的二進位制值：

Java程式碼

1100000010000110110101010001001
10111100001001110111000100010001
11111011111010101010000111001001
11001010011000100110110111011111
10001010100010111101011010011110

50的二進位制值：110010.減去1後的二進位制：110001

32的二進位制值: 100000.減去1後的二進位制：11111

因此h和 49 (即110001)與的結果只能為

000000 ： 0

000001 ： 1

010000 ： 16

010001 ： 17

100000 ： 32

100001 ： 33

110000 ： 48

110001 ： 49

而h和31 (即11111)與的結果為：

00000

00001

00010

....

11110

11111

這下知道原因了吧。LOCK_NUM -1 二進位制中為1的位數越多，那麼分佈就平均。

這也就是為什麼HashMap預設大小為2的次冪，並且新增元素時，如果超過了一定的數量，那麼就將數量增大到原來的兩倍，其中非常重要的原因就是為了hash的平均分佈。

知道為啥HashMap裡面的陣列size必須是2的次冪？

最近在寫一個簡易的分離鎖的類: 要求：對不同的Key進行hash得到一個Lock，並要求對鎖對映的概率差不多。比如，160個Key，分佈到16個鎖上，大概有10個Key是對映到同一個鎖上的，只要這樣併發效率才會高。 Java程式碼 public clas

HashMap 容量為2次冪的原因

我們都知道 hashmap 的底層是一個數組加連結串列的結構，當向其中新增一個元素的時候，需要根據key的hash值，去確定其在陣列中的具體位置。看原始碼，我們可以發現，確定陣列位置的實現是 i=（n-1）& hash，其中 n 代表陣列的長度，即map的容量。當n為2的冪

為什麼HashMap的桶數量是2的冪次方

前段時間去面試的時候坐在等候室裡，聽到隔壁會議室裡的面試：面試官：“你說一下為什麼HashMap的長度為什麼要設計成2的冪次方” 面試者：“因為計算機計算是二進位制運算，所以balabala.....” 當時聽的很模糊，也不知道面試者回答的是不是對的，所以一直記著回來

求最接近cap的2次冪（tableSizeFor函式的實現）

不比cap小的2次冪（HashMap中的tableSizeFor函式）// 初始化臨界值的具體實現 static final int tableSizeFor(int cap) { int n = cap - 1; n |= n >>>

獲取比某個數大的最小2次冪數

shm map ble 最小 size fin jdk1.8 代碼 pac static final int tableSizeFor(int cap) { int n = cap - 1; n |= n >>> 1; n |= n &g

什麼是雜湊表 HashMap 中陣列的 size 為什麼必須是 2 的整數次冪

Hash，一般翻譯做“雜湊”，也有直接音譯為“雜湊”的，就是把任意長度的輸入（又叫做預對映， pre-image），通過雜湊演算法，變換成固定長度的輸出，該輸出就是雜湊值。這種轉換是一種壓縮對映，也就是，雜湊值的空間通常遠小於輸入的空間，不同的輸入可能會雜湊成相同的輸出，

C#雞兔同籠（一個籠子裡面關了雞和兔子（雞有2 只腳，兔子有4 只腳，沒有例外）。已經知道了籠子裡面腳的總數a，問籠子裡面至少有多少隻動物，至多有多少隻動物? 請用C#語言實現這個計算過程；）

public static void Problem1(int a) { &n

HashMap中的為什麼hash的長度為2的冪而&位必須為奇數

背景雜湊演算法在Java中是經常用的的一個演算法，也是一些常用資料結構中必用的一個演算法，它為上層的複雜資料結構提供了基礎支撐。雜湊演算法的實現有很多種，除了這裡講的map中的hashcode演算法，還有其他雜湊演算法： 1.直接定址法 2.數字分析

hashmap初試陣列大小為什麼一定要是2 的倍數

1、在hashmap 的底層原始碼中，首先會計算一個 key 的 hash 碼，比如計算一個字串 "1".hashcode(); 會得到 hashcode 的大小為 49，但是 hashmap 預設陣列的大小是 16，所以這樣肯定是不能存到數組裡面的，會越界2、需要再次通過一

對陣列 [3, 1, 2, 4, 2, 4, 5, 3, 7] 進行去重, 寫出至少兩種方法 (請寫出一段Python程式碼實現刪除一個list裡面的重複元素)

1. 對陣列 [3, 1, 2, 4, 2, 4, 5, 3, 7] 進行去重, 寫出至少兩種方法 (請寫出一段Python程式碼實現刪除一個list裡面的重複元素)In [1]:def unique1

java裡面陣列簡單認識

陣列認識：陣列申請記憶體時，在空間上是連續的(如何證明陣列在空間連續呢)，陣列的優點主要是查詢比較快 jdk中的陣列： java替我們封裝了許多內建物件，我們只需要傳遞引數就可以，例如：Arrays物件構造方法：分析：可以看出構造方法被私有化，這樣我們就不會產生新的物

為什麼JavaScript裡面0.1+0.2 === 0.3是false

0.1+0.2 === 0.3 //返回是false，這是為什麼呢？？我們知道浮點數計算是不精確的，上面的返回式實際上是這樣的：0.1 + 0.2 = 0.30000000000000004 0.1 + 0.2 - 0.3 = 5.551115123125783e-17 5.551115123125

Unity中使用C#遞迴輸出陣列1，2，3，5，8，...該陣列的生成規律是每一個數字是前兩個數字的和

一、實現思路：第一個數大於等於0，第二個數大於等於第一個數，最後指定一個需要輸出的最後一個數字（該數字用作最後輸出的界限） ①實現指令碼如下： /*** * Title："XXX" 專案 * 主題：XXX * Description： * 功能：XXX * Date：2018 * Ver

樹狀陣列（模板2 區修單查）

luogu 3368 區間修改，單點查詢差分+樹狀陣列模板如下： #include <bits/stdc++.h> #define ll long long #define N 500005 using namespace std; int a[N],c[N];

給定陣列a[0:n-1]試設計一個演算法，在最壞情況下用[3n/2 -2 ] 次比較找出a[0:n-1]中元素的最大值和最小值；教材2-15

給定陣列a[0:n-1]試設計一個演算法，在最壞情況下用[3n/2 -2 ] 次比較找出a[0:n-1]中元素的最大值和最小值；解：要求對於陣列用小於【3n/2-2】的比較次數找到兩個最值可以用陣列第一個元素來初始化max，min 然後遍歷陣列，分別和max，min比較，一遍就可以找

JavaScript陣列常用方法2

1.forEach()方法列出每個元素 <button onclick="numbers.forEach(myFunction)">點我</button> <p id="demo"></p> <script> demoP = do

HashMap的初始大小為什麼是2的n次冪？

下面是HashMap的一個建構函式，兩個引數initialCapacity,loadFactor 這關係HashMap的迭代效能。關於這兩個引數值的設定界限： 1. initialCapacity是map的初始化容量，initialCapacity > M

No.26 我與程式碼的日常：逆轉整數，迴文字串，迴文數字，查詢陣列中遺漏數字，判斷2的冪

學習不易，需要堅持。逆轉整數：Reverse Integer Example1: x = 123, return 321 Example2: x = -123, return -321 處理溢位：比如整數最大值2147483647逆轉之後的整數值不存在要求所有值逆轉之後再

【5】C++進階系列（陣列和指標2）

1、實驗實驗1：3 x 3矩陣的轉置 #include<iostream> using namespace std; void swap(int &a, int &b) { int temp = a; a = b; b = temp;

c語言編掃雷（不知道為啥漢字是亂碼）

#include<stdio.h> #include<stdlib.h> #include<time.h> int main(){ int hang,lie,dilei; int i,j,n;

知道為啥HashMap裡面的陣列size必須是2的次冪？

相關推薦