128 哈希函數
原題網址:https://www.lintcode.com/problem/hash-function/description
描述
在數據結構中,哈希函數是用來將一個字符串(或任何其他類型)轉化為小於哈希表大小且大於等於零的整數。一個好的哈希函數可以盡可能少地產生沖突。一種廣泛使用的哈希函數算法是使用數值33,假設任何字符串都是基於33的一個大整數,比如:
hashcode("abcd") = (ascii(a) * 333 + ascii(b) * 332 + ascii(c) *33 + ascii(d)) % HASH_SIZE
= (97* 333 + 98 * 332 + 99 * 33 +100) % HASH_SIZE
= 3595978 % HASH_SIZE
其中HASH_SIZE表示哈希表的大小(可以假設一個哈希表就是一個索引0 ~ HASH_SIZE-1的數組)。
給出一個字符串作為key和一個哈希表的大小,返回這個字符串的哈希值。
您在真實的面試中是否遇到過這個題?說明
For this problem, you are not necessary to design your own hash algorithm or consider any collision issue, you just need to implement the algorithm as described.
樣例
對於key="abcd" 並且 size=100, 返回 78
標簽 哈希表
思路:哈希函數的實現算法題目已經給出了,照著實現就好。這題考察的是類似大數階乘的數據溢出問題,如果直接將字符串轉成整數再求余,emmm……一般會溢出。所以在將字符串逐個字符轉成整數的過程中就應該取余防止數據過大。
對於整數求模,(a * b) % m = a % m * b % m這個基本公式務必牢記。根據這個公式我們可以大大降低時間復雜度和規避溢出。 轉載至此處
具體實現方式可以從高位(權值大的)到低位(權值小的)依次轉化,也可以從低位到高位依次轉化,後者需要額外定義一個權值,每次循環時*33,權值也同樣需要取余。
AC代碼(高位到低位):
class Solution { public: /** * @param key: A string you should hash * @param HASH_SIZE: An integer * @return: An integer */ int hashCode(string &key, int HASH_SIZE) { // write your code here int n=key.size(); if (n==0) { return 0; } long result=key[0];//註意數據類型是long,防止數據過大造成溢出; for (int i=1;i<n;i++) { result=result*33+key[i]; result=result%HASH_SIZE;//及時求余防溢出; } return result; } };
低位到高位代碼:
int hashCode(string &key, int HASH_SIZE) { int n=key.size(); if (n==0) { return 0; } long result=0;//註意數據類型; long hashBase=1;//權值,註意數據類型; for (int i=n-1;i>=0;i--) { result=result+key[i]*hashBase; result=result%HASH_SIZE;//及時求余防溢出; hashBase=hashBase*33%HASH_SIZE;//及時求余防溢出; } return result; }
參考:https://blog.csdn.net/nawuyao/article/details/50953557
https://www.cnblogs.com/libaoquan/p/7217165.html
https://www.jianshu.com/p/9a67268b5a94
https://blog.csdn.net/outmain/article/details/51233385
https://blog.csdn.net/ljlstart/article/details/48391799
128 哈希函數