1. 程式人生 > >JZOJ 5462. 【NOIP2017提高A組衝刺11.8】好文章

JZOJ 5462. 【NOIP2017提高A組衝刺11.8】好文章

Description

nodgd寫了一篇文章,自認為這是一篇好文章。nodgd的文章由n個小寫英文字母組成。文章的一個子串指的是文章中的一段連續的字母,子串的長度就是這一段的字母個數。nodgd在文章中用了排比、對偶、前後照應之類的手法,所以就有很多個子串是相同或者相近的。為了向大家證明這是一篇好文章,nodgd決定給自己的文章進行評分。nodgd首先確定了一個整數m,然後統計出文章中有多少個不相同的長度為m的子串,這個數量就是文章的評分。
然而,nodgd懶得老老實實計算這個評分了,就把任務丟給了你。

Input

第一行包含兩個整數n,m,表示文章的長度和需要統計的子串長度。
第二行包含一個長度為n的只包含小寫字母的字串。

Output

輸出一行一個整數,表示文章的評分。

Sample Input

輸入1:

5 3
aaaab

輸入2:

9 3
abcabacba

Sample Output

輸出1:

2

樣例解釋1:

長度為3的子串有3個,分別是aaa,aaa,aab,其中不同的只有2個。

輸出2:

7

樣例解釋2

共有7個長度為3的子串,每個長度為3的子串都不同。

Data Constraint

對於30%的資料,1≤��≤��≤200;
對於50%的資料,1≤��≤��≤2000;
對於另外20%的資料,1≤��≤50≤��≤200000;
對於100%的資料,1≤��≤��≤200000。

Solution

  • 典型的字串Hash,但是模數要開大點(或者雙雜湊),不然會被卡。

  • 先算出前 m 位的雜湊值,之後一位一位推到後面即可。

Code

#include<cstdio>
#include<cstring>
using namespace std;
typedef long long LL;
const int N=2e5+5,mo=1e7+9;
const LL mod=1e15+7;
int n,m,ans;
LL sum,p;
LL h[mo];
int f[N];
char s[N];
inline int hash(LL x)
{
    int y=x%mo;
    while
(h[y]>=0 && h[y]!=x) y=(y+1)%mo; return y; } int main() { scanf("%d%d",&n,&m); scanf("%s",s+1); memset(h,-1,sizeof(h)); ans=p=1; for(int i=m;i;i--) { sum=(sum+(s[i]-'a')*p%mod)%mod; if(i>1) p=p*26%mod; } h[hash(sum)]=sum; for(int i=2;i<=n-m+1;i++) { sum=(sum+mod-(s[i-1]-'a')*p%mod)%mod; sum=(sum*26%mod+s[i+m-1]-'a')%mod; int k=hash(sum); if(h[k]<0) h[k]=sum,ans++; } printf("%d",ans); return 0; }