HashMap中的hash演算法總結

阿新 • • 發佈：2018-11-27

前言

演算法一直是我的弱項，然而面試中基本是必考的專案，剛好上次看到一個HashMap的面試題，今天也來學習下 HashMap中的hash演算法是如何實現的。

數學知識回顧

<< : 左移運算子，num << 1,相當於num乘以2 低位補0
舉例：3 << 2
將數字3左移2位，將3轉換為二進位制數字0000 0000 0000 0000 0000 0000 0000 0011，然後把該數字高位(左側)的兩個零移出，其他的數字都朝左平移2位，最後在低位(右側)的兩個空位補零。則得到的最終結果是0000 0000 0000 0000 0000 0000 0000 1100，則轉換為十進位制是12。
數學意義：
在數字沒有溢位的前提下，對於正數和負數，左移一位都相當於乘以2的1次方，左移n位就相當於乘以2的n次方。
>>: 右移運算子
舉例：11 >> 2
則是將數字11右移2位，11 的二進位制形式為：0000 0000 0000 0000 0000 0000 0000 1011，然後把低位的最後兩個數字移出，因為該數字是正數，所以在高位補零。則得到的最終結果是0000 0000 0000 0000 0000 0000 0000 0010。轉換為十進位制是3。
數學意義：
右移一位相當於除2，右移n位相當於除以2的n次方。這裡是取商哈，餘數就不要了。
>>> : 無符號右移，忽略符號位，空位都以0補齊
按二進位制形式把所有的數字向右移動對應位數，低位移出(捨棄)，高位的空位補零。對於正數來說和帶符號右移相同，對於負數來說不同。其他結構和>>相似。
% : 模運算取餘
簡單的求餘運算
^ : 位異或第一個運算元的的第n位於第二個運算元的第n位相反，那麼結果的第n為也為1，否則為0
0^0=0， 1^0=1， 0^1=1， 1^1=0
& : 與運算第一個運算元的的第n位於第二個運算元的第n位如果都是1，那麼結果的第n為也為1，否則為0
0&0=0， 0&1=0， 1&0=0， 1&1=1
| : 或運算第一個運算元的的第n位於第二個運算元的第n位只要有一個是1，那麼結果的第n為也為1，否則為0
0|0=0， 0|1=1， 1|0=1， 1|1=1
~ : 非運算運算元的第n位為1，那麼結果的第n位為0，反之，也就是取反運算（一元操作符：只操作一個數）
~1=0， ~0=1

HashMap中的hash演算法

首先要明白一個概念，HashMap中定位到桶的位置是根據Key的hash值與陣列的長度取模來計算的。
具體的細節我就不說了，預設認為大家都懂這一點。
取模可以改為：hashCode & （length - 1）
看下JDK8中的hash 演算法：

 static final int hash(Object key) {
        int h;
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }

首先是取key的hashCode演算法，然後對16進行異或運算和右移運算。
在分析上面異或運算和右移運算問題之前，我們需要先看看另一個事情，什麼呢？就是 HashMap 如何根據 hash 值找到陣列種的物件，我們看看 get 方法的程式碼：

  final Node<K,V> getNode(int hash, Object key) {
        Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
        if ((tab = table) != null && (n = tab.length) > 0 &&
            // 我們需要關注下面這一行
            (first = tab[(n - 1) & hash]) != null) {
            if (first.hash == hash && // always check first node
                ((k = first.key) == key || (key != null && key.equals(k))))
                return first;
            if ((e = first.next) != null) {
                if (first instanceof TreeNode)
                    return ((TreeNode<K,V>)first).getTreeNode(hash, key);
                do {
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        return e;
                } while ((e = e.next) != null);
            }
        }
        return null;
    }

我們看看程式碼中註釋下方的一行程式碼：first = tab[(n - 1) & hash])。
使用陣列長度減一與運算 hash 值。這行程式碼就是為什麼要讓前面的 hash 方法移位並異或。

** 我們分析一下：**
首先，假設有一種情況，物件 A 的 hashCode 為 1000010001110001000001111000000，物件 B 的 hashCode 為 0111011100111000101000010100000。

如果陣列長度是16，也就是 15 與運算這兩個數（前面說的hashCode & （length - 1）），你會發現結果都是0。這樣的雜湊結果太讓人失望了。很明顯不是一個好的雜湊演算法。

但是如果我們將 hashCode 值右移 16 位，也就是取 int 型別的一半，剛好將該二進位制數對半切開。並且使用位異或運算（如果兩個數對應的位置相反，則結果為1，反之為0），這樣的話，就能避免我們上面的情況的發生。簡而言之就是儘量打亂hashCode的低16位，因為真正參與運算的還是低16位。

不知道這種解釋是否是簡單明瞭，經過自己的思考和分析後也明白了這段程式碼設計的初衷，也會感嘆設計者的精妙。

如有疑問歡迎留言，如有遺漏或錯誤的地方也歡迎指出。

HashMap中的hash演算法總結

前言

數學知識回顧

HashMap中的hash演算法

HashMap中的hash演算法總結

機器學習中常用演算法總結

機器學習中優化演算法總結以及Python實現

演算法導論中的演算法總結

hashmap 中hash函式h & (length-1)詳解

深入理解 hashcode() 和 HashMap 中的hash 演算法

演算法---hash演算法原理(java中HashMap底層實現原理和原始碼解析)

HashMap中的hash演算法中的幾個疑問

Java中的HashCode 1 之hash演算法基本原理

【轉】【java原始碼分析】Map中的hash演算法分析

Java架構/一致性Hash演算法在資料庫分表中的實踐

轉：【總結】推薦系統中常用演算法以及優點缺點對比

關於HashMap中KEY的有序排列的反思和總結(對應TreeMap)

一致性Hash演算法在資料庫分表中的實踐

資料結構中排序、查詢、最小生成樹演算法總結

redis原始碼分析與思考（三）——字典中鍵的兩種hash演算法

hash演算法 (hashmap 實現原理)

JAVA中HashMap相關知識的總結(一)

【演算法筆記】雜湊（hash）總結

演算法基礎（面試）面試中的排序演算法總結

HashMap中的hash演算法總結

前言

數學知識回顧

HashMap中的hash演算法

相關推薦