JZOJ 5462. 【NOIP2017提高A組衝刺11.8】好文章
阿新 • • 發佈:2019-02-20
Description
nodgd寫了一篇文章,自認為這是一篇好文章。nodgd的文章由n個小寫英文字母組成。文章的一個子串指的是文章中的一段連續的字母,子串的長度就是這一段的字母個數。nodgd在文章中用了排比、對偶、前後照應之類的手法,所以就有很多個子串是相同或者相近的。為了向大家證明這是一篇好文章,nodgd決定給自己的文章進行評分。nodgd首先確定了一個整數m,然後統計出文章中有多少個不相同的長度為m的子串,這個數量就是文章的評分。
然而,nodgd懶得老老實實計算這個評分了,就把任務丟給了你。
Input
第一行包含兩個整數n,m,表示文章的長度和需要統計的子串長度。
第二行包含一個長度為n的只包含小寫字母的字串。
Output
輸出一行一個整數,表示文章的評分。
Sample Input
輸入1:
5 3
aaaab
輸入2:
9 3
abcabacba
Sample Output
輸出1:
2
樣例解釋1:
長度為3的子串有3個,分別是aaa,aaa,aab,其中不同的只有2個。
輸出2:
7
樣例解釋2
共有7個長度為3的子串,每個長度為3的子串都不同。
Data Constraint
對於30%的資料,1≤��≤��≤200;
對於50%的資料,1≤��≤��≤2000;
對於另外20%的資料,1≤��≤50≤��≤200000;
對於100%的資料,1≤��≤��≤200000。
Solution
典型的字串Hash,但是模數要開大點(或者雙雜湊),不然會被卡。
先算出前
m 位的雜湊值,之後一位一位推到後面即可。
Code
#include<cstdio>
#include<cstring>
using namespace std;
typedef long long LL;
const int N=2e5+5,mo=1e7+9;
const LL mod=1e15+7;
int n,m,ans;
LL sum,p;
LL h[mo];
int f[N];
char s[N];
inline int hash(LL x)
{
int y=x%mo;
while (h[y]>=0 && h[y]!=x) y=(y+1)%mo;
return y;
}
int main()
{
scanf("%d%d",&n,&m);
scanf("%s",s+1);
memset(h,-1,sizeof(h));
ans=p=1;
for(int i=m;i;i--)
{
sum=(sum+(s[i]-'a')*p%mod)%mod;
if(i>1) p=p*26%mod;
}
h[hash(sum)]=sum;
for(int i=2;i<=n-m+1;i++)
{
sum=(sum+mod-(s[i-1]-'a')*p%mod)%mod;
sum=(sum*26%mod+s[i+m-1]-'a')%mod;
int k=hash(sum);
if(h[k]<0) h[k]=sum,ans++;
}
printf("%d",ans);
return 0;
}