1. 程式人生 > 實用技巧 >字串雜湊

字串雜湊

題目描述

acwing841. 字串雜湊

給定一個長度為n的字串,再給定m個詢問,每個詢問包含四個整數l1,r1,l2,r2,請你判斷[l1,r1]和[l2,r2]這兩個區間所包含的字串子串是否完全相同。

字串中只包含大小寫英文字母和數字。

輸入格式

第一行包含整數n和m,表示字串長度和詢問次數。

第二行包含一個長度為n的字串,字串中只包含大小寫英文字母和數字。

接下來m行,每行包含四個整數l1,r1,l2,r2,表示一次詢問所涉及的兩個區間。

注意,字串的位置從1開始編號。

輸出格式

對於每個詢問輸出一個結果,如果兩個字串子串完全相同則輸出“Yes”,否則輸出“No”。

每個結果佔一行。

資料範圍

1≤n,m≤105

輸入樣例:

8 3

aabbaabb

1 3 5 7

1 3 6 8

1 2 1 2

輸出樣例:

Yes

No

Yes

演算法 字串hash

核心思想:將字串看成P進位制數,P的經驗值是131或13331,取這兩個值的衝突概率低

小技巧:
由於字首值的值會很大 取模的數用2^64,這樣直接用unsigned long long儲存,溢位的結果就是取模的結果,
取模2^64的這種題目。遇到這種限制條件時就要想到用unsigned long long型別。
可以簡潔地宣告為typedef unsigned long long ull。這樣,如果ull型別的整數溢位了,就相當於取模264了。因為ull的範圍是[0,2

64-1]。

c++ 程式碼

#include<iostream>
using namespace std;
const int N=100010,P=131;
typedef unsigned long long ull;
ull h[N],p[N];// h[k]儲存字串前k個字母的雜湊值, p[k]儲存第k位的權值 P^k mod 2^64
int n,m;
char s[N];
ull get(int l,int r)
{
    return h[r]-h[l-1]*p[r-l+1];//相當於把1~l-1的所有位左移r-l+r,相減後就是l~r的hash值
}
int main()
{
    cin>>n>>m>>s+1;
    p[0]=1;
    for(int i=1;i<=n;i++)
    {
        p[i]=p[i-1]*P;//預處理,把冪也預處理出來
        h[i]=h[i-1]*P+s[i];//只要s[i]不等於0就行
    }
    while(m--)
    {
        int l1,r1,l2,r2;
        scanf("%d%d%d%d",&l1,&r1,&l2,&r2);
        if(get(l1,r1)==get(l2,r2)) puts("Yes");
        else puts("No");
    }
    return 0;
}