1. 程式人生 > >CH 1401 兔子與兔子 字串hash

CH 1401 兔子與兔子 字串hash

描述
很久很久以前,森林裡住著一群兔子。有一天,兔子們想要研究自己的 DNA 序列。我們首先選取一個好長好長的 DNA 序列(小兔子是外星生物,DNA 序列可能包含 26 個小寫英文字母),然後我們每次選擇兩個區間,詢問如果用兩個區間裡的 DNA 序列分別生產出來兩隻兔子,這兩個兔子是否一模一樣。注意兩個兔子一模一樣只可能是他們的 DNA 序列一模一樣。

輸入格式
第一行一個 DNA 字串 S。
接下來一個數字 m,表示 m 次詢問。
接下來 m 行,每行四個數字 l1, r1, l2, r2,分別表示此次詢問的兩個區間,注意字串的位置從1開始編號。
其中 1 ≤ length(S), m ≤ 1000000

輸出格式
對於每次詢問,輸出一行表示結果。如果兩隻兔子完全相同輸出 Yes,否則輸出 No(注意大小寫)

樣例輸入
aabbaabb
3
1 3 5 7
1 3 6 8
1 2 1 2
樣例輸出
Yes
No
Yes

題意:判斷一個字串中,[l1,r1]與[l2,r2]是否完全相等

思路:利用字串hash演算法。設F[i]表示字首子串S[1—i]的hash值,有F[i]=F[i-1]*131+(S[i]-'a'+1)

於是可以得到任意一個區間[l,r]的hash值為F[r]-F[l-1]*131^(r-l+1),當兩個字串的hash值相同的時候,兩個子串相同,時間複雜度為O(S+Q)。

字串hash演算法:

  當已知的字串S的hash值為H(S), 那麼在S後加一個字元c構成一個新的字串S+c的hash值為H(S+c)=(H(S)*P+value[c])mod M,其中P相當於P進位制下的左移運算,value[c]代表著我們為c選定的值。

 當已知字串S的hash值為H(S),字串S+H的hash值為H(S+H),那麼字串T的hash值為H(T)=(H(S+T)-H(S)*P^length(T))%M。相當於通過P進位制下在S後補0的方式,把S左移到與S+T的左端對齊,然後二者相減得到H(T)

#include <cstdio>
#include <iostream>
#include <cstring>
#include <algorithm>
#include <map>
#include <set>
#include <queue>
#include <cmath>
#include <vector>
using namespace std;
const int MAXN=1e6+5;
typedef long long ll;
ll f[MAXN],p[MAXN];
char s[MAXN];
int main()
{
    scanf("%s",s+1);
    int n=strlen(s+1),q;
    cin>>q;
    p[0]=1;
    for(int i=1;i<=n;i++){
        f[i]=f[i-1]*131+(s[i]-'a'+1); //hash 1——i
        p[i]=p[i-1]*131;
    }
    for(int i=1;i<=q;i++){
        int l1,r1,l2,r2;
        scanf("%d%d%d%d",&l1,&r1,&l2,&r2);
        if(f[r1]-f[l1-1]*p[r1-l1+1]==f[r2]-f[l2-1]*p[r2-l2+1])
            puts("Yes");
        else
            puts("No");
    }
    return 0;
}