Hash演算法有哪些？

阿新 • • 發佈：2020-10-14

轉載:https://www.jianshu.com/p/958eb591ecd6

Hash演算法的有哪幾種，優缺點，使用場景

Hash ，一般叫做雜湊演算法，就是把任意長度的輸入通過雜湊演算法，變換成固定長度的輸入，相當於一種壓縮對映，將任意長度的訊息壓縮到某一固定長度的訊息摘要的函式。

• 加法Hash；把輸入元素一個一個的加起來構成最後的結果

/**
  * 加法hash
  *
  * @param key
  *            字串
  * @param prime
  *            一個質數
  * @return hash結果
  */
public static int 
 additiveHash(String key, int prime) {
  int hash, i;
  for (hash = key.length(), i = 0; i < key.length(); i++)
      hash += key.charAt(i);
  return (hash % prime);
}

• 位運算Hash；這型別Hash函式通過利用各種位運算（常見的是移位和異或）來充分的混合輸入元素

/**
  * 旋轉hash
  *
  * @param key
  *            輸入字串
  * @param prime
  *            質數
  *  
@return hash值
  */
public static int rotatingHash(String key, int prime) {
  int hash, i;
  for (hash = key.length(), i = 0; i < key.length(); ++i)
      hash = (hash << 4) ^ (hash >> 28) ^ key.charAt(i);
  return (hash % prime);
  // return (hash ^ (hash>>10) ^ (hash>>20));
}

• 乘法Hash；這種型別的Hash函式利用了乘法的不相關性（乘法的這種性質，最有名的莫過於平方取頭尾的隨機數生成演算法，雖然這種演算法效果並不好）；

static 
 int bernstein(String key)
{
    int hash = 0;
    int i;
    for (i=0; i<key.length(); ++i) hash = 33*hash + key.charAt(i);
    return hash;
}

jdk5.0裡面的String類的hashCode()方法也使用乘法Hash；32位FNV演算法

int M_SHIFT = 0;
public int FNVHash(byte[] data) {
  int hash = (int) 2166136261L;
  for(byte b : data)
    hash = (hash * 16777619) ^ b;
  if(M_SHIFT == 0)
    return hash;
  return (hash ^ (hash >> M_SHIFT)) & M_MASK;
}

改進後的 FNV 演算法

public static int FNVHash1(String data) {
        final int p = 16777619;
        int hash = (int) 2166136261L;
        for (int i = 0; i < data.length(); i++)
            hash = (hash ^ data.charAt(i)) * p;
        hash += hash << 13;
        hash ^= hash >> 7;
        hash += hash << 3;
        hash ^= hash >> 17;
        hash += hash << 5;
        return hash;
    }

常見的還有乘以一個不斷改變的數

static int RSHash(String str) {
        int b = 378551;
        int a = 63689;
        int hash = 0;
        for (int i = 0; i < str.length(); i++) {
            hash = hash * a + str.charAt(i);
            a = a * b;
        }
        return (hash & 0x7FFFFFFF);
    }

• 除法Hash；除法和乘法一樣，同樣具有表面上看起來的不相關性。不過，因為除法太慢，這種方式幾乎找不到真正的應用

• 查表Hash；查表Hash最有名的例子莫過於CRC系列演算法。雖然CRC系列演算法本身並不是查表，但是，查表是它的一種最快的實現方式。查表Hash中有名的例子有：Universal Hashing和Zobrist Hashing。他們的表格都是隨機生成的。

• 混合Hash；混合Hash演算法利用了以上各種方式。各種常見的Hash演算法，比如MD5、Tiger都屬於這個範圍。它們一般很少

陣列 hash

inline int hashcode(const int *v)
{
  int s = 0;
  for(int i=0; i<k; i++)
    s=((s<<2)+(v[i]>>4))^(v[i]<<10);
  s = s % M;
  s = s < 0 ? s + M : s;
  return s;
}

在面向查詢的Hash函式裡面使用

環 hash

環 hash 計算步驟

首先求出雜湊值，並將其分配到 0~2^32 的圓上，其實把機器編號 hash 到這個環上。
採用同樣的方法求出儲存資料鍵的雜湊值，並對映到相同的圓上
然後從資料對映到位置開始順時針開始找，將資料儲存到找到的第一個伺服器，如果 2^32 仍然找不到伺服器，就會儲存到第一臺伺服器上。

圖片.png

環 hash 存在的問題

資料傾斜問題

資料傾斜是指，當機器不多時，幾臺機器在環上面貼的很近，分佈是不是很均勻，會導致大部分資料集中到這幾臺機器上，這樣就產生了資料傾斜問題。

如何解決資料傾斜問題？

引入了虛擬機器器概念，一臺機器需要在環上映射出多個這個位置，比如我們用機器的 ip 來 hash ，這樣就實現了一臺物理機映射出多個虛擬機器器的編號。

參考資料

Hash演算法有哪些？

轉載:https://www.jianshu.com/p/958eb591ecd6 Hash演算法的有哪幾種，優缺點，使用場景 Hash ，一般叫做雜湊演算法，就是把任意長度的輸入通過雜湊演算法，變換成固定長度的輸入，相當於一種壓縮對映，將任意長度

抄作業：LBM演算法有哪些優勢？

之前在LBM交流群裡總是見到同學提問LBM的優勢在哪，也有老哥看到大家提問，便親自問了小紅書作者這個問題，記得不是很清楚了，大概就是每個人都有自己喜歡的模擬方法，LBM程式碼簡潔，容易實現。

RocketMQ（六）發訊息的時候選擇queue的演算法有哪些？

一、說明分為兩種，一種是直接發訊息，client內部有選擇queue的演算法，不允許外界改變。還有一種是可以自定義queue的選擇演算法（內建了三種演算法，不喜歡的話可以自定義演算法實現）。

常用的演算法有哪些?

- 氣泡排序　　1.元素兩兩比較，然後將較大的元素逐步向後偏移（將最大值逐步移動到最後位置）　　2.迴圈上一步操作即可

按照鎖的粒度分資料庫鎖有哪些？鎖機制與InnoDB鎖演算法？

在關係型資料庫中，可以按照鎖的粒度把資料庫鎖分為行級鎖(INNODB引擎)、表級鎖(MYISAM引擎)和頁級鎖(BDB引擎 )。

資料結構與演算法_22 _ 雜湊演算法（下）：雜湊演算法在分散式系統中有哪些應用

上一節，我講了雜湊演算法的四個應用，它們分別是：安全加密、資料校驗、唯一標識、雜湊函式。今天，我們再來看剩餘三種應用：負載均衡、資料分片、分散式儲存。

每日一題：面向物件的特徵有哪些？

問題：面向物件的特徵有哪些？答：封裝，繼承，多型和抽象。 1. 封裝封裝給物件提供了隱藏內部特性和行為的能力。物件提供一些能被其他物件訪問的方法來改變它內部的資料。在 Java 當中，有 3 種修飾符:public，pr

再見了，空指標異常(NullPointerException)！看看有哪些好的實踐可以避開它

1. 快速介紹空指標異常，只有大家寫過業務系統，一定對它不陌生。它是一個執行時錯誤，一般而言常見邏輯不嚴謹、懶散的程式碼風格導致。它的原因理解起來很簡單，但是要避免它卻不是一件容易的事。下面我記錄了一些

2019雙11，支付寶有哪些“祕密武器”？

2019雙11，支付寶參戰的第十一年。與十一年前相比，雙11的許多東西都改變了。比如金額——2684億，差不多是十一年前的5000倍；比如流量——訂單峰值54.4萬筆/秒，曾經是想都不敢想的數字；再比如層出不窮的新技術，

Django 2 0 釋出，都有哪些新特性要注意？

Django 是 Python Web 開發最常用的框架之一，跟進它的最新變化絕對是必須的。 2017年12月2日，Django官方釋出了2.0版本，成為多年來的第一次大版本提升，那麼2.0對廣大Django使用者有哪些變化和需要注意的地方呢？

本月16日SpringBoot2.2釋出，有哪些變化先知曉

本月（2019年10月16日）Spring Boot 2.2已經正式釋出了!在此篇文章中，將給大家介紹一下2.2版為大家帶來了哪些重要的新變化。筆者用心書寫，希望閱讀完成之後轉發關注，你的支援是我不竭的創作動力！

關於 JVM，都有哪些面試最常考的點需要重點掌握？

這裡僅僅記錄了一些筆者認為需要重點掌握的 JVM 知識點，如果你想更加全面地瞭解 JVM 底層原理，可以閱讀周志明老師《深入理解Java虛擬機器器——JVM高階特性與最佳實踐(第2版)》全書。

分散式鎖都有哪些實現方案？

一、業務場景同一個jvm裡多個執行緒操作同一個有狀態的變數，可以通過JVM內的鎖保證執行緒安全。

什麼是分散式事務以及有哪些解決方案？

1、什麼是分散式事務？答：指一次大的操作由不同的小操作組成的，這些小的操作分佈在不同的伺服器上，分散式事務需要保證這些小操作要麼全部成功，要麼全部失敗。從本質上來說，分散式事務就是為了保證不同資料庫的

騰訊面試：一條SQL語句執行得很慢的原因有哪些？---不看後悔系列(推薦)

說實話，這個問題可以涉及到 MySQL 的很多核心知識，可以扯出一大堆，就像要考你計算機網路的知識時，問你“輸入URL回車之後，究竟發生了什麼”一樣，看看你能說出多少了。

MySQL中有哪些情況下資料庫索引會失效詳析

前言要想分析MySQL查詢語句中的相關資訊，如是全表查詢還是部分查詢，就要用到explain.

mysql中的limit用法有哪些(推薦)

SELECT * FROM 表名 limit m,n; SELECT * FROM table LIMIT [offset,] rows; 1.m代表從m+1條記錄行開始檢索，n代表取出n條資料。(m可設為0)

淺析Python語言自帶的資料結構有哪些

Python作為一種指令碼語言，其要求強制縮排，使其易讀、美觀，它的資料型別可以實現自動轉換，而不需要像C、Java那樣給變數定義資料型別，使其編寫非常方便簡單，所以廣受大家的歡迎。

雲資料庫CynosDB有哪些常見問題？

本文分享騰訊雲CynosDB 資料庫的常見問題及相關解答。更多參閱官方文件 CynosDB 與傳統資料庫有什麼不同？

Python中常見的數制轉換有哪些

數制轉換即進位制轉換，指進位制（二、八、十、十六進位制）間的相互轉換，計算機程式設計中較為常見。這裡列舉了python常見數制轉換用法。

Hash演算法有哪些？

Hash演算法的有哪幾種，優缺點，使用場景

環 hash

環 hash 存在的問題

資料傾斜問題

如何解決資料傾斜問題？

參考資料

相關推薦