[jzoj5462]【NOIP2017提高A組衝刺11.8】好文章
阿新 • • 發佈:2019-02-17
標籤:雜湊
Solution
題目實際要求我們求出重複的子串數
容易想到的 可以求出每個子串的 hash 值 然後排序 最後掃一遍
那麼這裡也淺談一下 hash 演算法
My Style
我一般會設兩個質數 稱較小的為 p 較大的為 P
比較基本的
為了防止被卡時間 減少程式碼複雜度
我們同時用多個 hash
一個或兩個作為鍵值 剩下的用於判斷是否完全相同
這道題的特點在於 所有字串都是一個串的子串
所以令設
用上述的方式計算即可簡便地判斷
具體見標程的 hash 函式
Code
#include <cmath>
#include <cstdio>
#include <cstring>
#include <iostream>
#include <algorithm>
#define fo(i,x,y) for (int i=(x);i<=(y);++i)
#define fd(i,x,y) for (int i=(x);i>=(y);--i)
#define oo 2139062143
using namespace std;
const int N=200200,PRI1=39916801/*11!+1*/,PRI2=9191891;
int n,m;
char st[N];
struct node{
int x,y;
}c[N];
int h1[N],h2[N];
int p1[N],p2[N];
int hash1(int sta)
{
int l=sta,r=sta+m-1;
return(1ll*(h1[r]-h1[l-1]+PRI1)%PRI1*p1[n-r]%PRI1);
}
int hash2(int sta)
{
int l=sta,r=sta+m-1;
return(1ll*(h2[r]-h2[l-1 ]+PRI2)%PRI2*p2[n-r]%PRI2);
}
bool cmp(node a,node b)
{
return(a.x<b.x||(a.x==b.x&&a.y<b.y));
}
int main()
{
// freopen("article.in","r",stdin);
// freopen("article.out","w",stdout);
scanf("%d%d\n%s",&n,&m,st+1);
p1[0]=p2[0]=1,p1[1]=9209,p2[1]=3881;
fo(i,2,n+100) p1[i]=(1ll*p1[i-1]*p1[1])%PRI1,p2[i]=(1ll*p2[i-1]*p2[1])%PRI2;
fo(i,1,n)
{
int now=st[i]-'a'+1;
h1[i]=(h1[i-1]+1ll*now*p1[i])%PRI1,h2[i]=(h2[i-1]+1ll*now*p2[i])%PRI2;
}int tot=n-m+1;
int tmp1=hash1(1);
int tmp2=hash1(2);
fo(i,1,tot)
c[i].x=hash1(i),c[i].y=hash2(i);
sort(c+1,c+1+tot,cmp);
int ans=tot;
fo(i,2,tot)
if(c[i].x==c[i-1].x&&c[i].y==c[i-1].y)
--ans;
printf("%d\n",ans);
return 0;
}