1. 程式人生 > 其它 >Codeforces 1466G - Song of the Sirens(雜湊)

Codeforces 1466G - Song of the Sirens(雜湊)

比較有意思的雜湊

Codeforces 題面傳送門 & 洛谷題面傳送門

事實證明,有的難度評分不算很高、涉及的知識點不算很難的題目也能出得非常神仙

首先考慮如何暴力求答案。注意到一個文字串 \(T\)\(s_k\) 中出現的位置,有兩種可能,要麼跨過中間的 \(t_k\),要麼沒跨過,前者等價於文字串在 \(s_{k-1}[|s_{k-1}|-|T|+2,|s_{k-1}|]+t_k+s_{k-1}[1,|T|-1]\) 中出現的次數。由於其長度為 \(\mathcal O(|T|)\),因此可以在 KMP 或雜湊在 \(\mathcal O(|T|)\) 時間內求出。要麼沒有跨過中間的 \(t_k\)

,而這樣的出現位置要麼在 \(s_0\) 中出現過,要麼在某個 \(s_{k'}(k'<k)\) 中作為跨過中間的 \(t_{k'}\) 的字串出現。因此

\[res=\text{occ}(t_0,T)·2^k+\sum\limits_{i=1}^k\text{occ}(s_{i}[|s_{i}|-|T|+2,|s_{i}|]+t_i+s_{i}[1,|T|-1],T)·2^{k-i} \]

其中 \(\text{occ}(s,t)\) 表示 \(t\)\(s\) 中的出現次數。

考慮優化。我們找到最小的 \(k'\),滿足 \(|t_{k'}|>|T|\),如果不存在這樣的 \(k'\)

\(k'>k\) 則直接輸出 \(\text{occ}(t_k,T)\) 即可。否則我們先令答案加上 \(\text{occ}(t_{k'},T)·2^{k-k'}\),而對於 \(i>k',j>k'\),由於 \(|T|<|s_i|,|T|<|s_j|\),如果 \(t_i=t_j\),那麼顯然有 \(s_{i}[|s_{i}|-|T|+2,|s_{i}|]+t_i+s_{i}[1,|T|-1]=s_{j}[|s_{j}|-|T|+2,|s_{j}|]+t_j+s_{j}[1,|T|-1]\),我們考慮列舉所有 \(t_j=c\),計算 \(\text{occ}(s_{i}[|s_{i-1}|-|T|+2,|s_{i}|]+c+s_{i}[1,|T|-1],T)\)
,然後字首和求出 \(\sum\limits_{i=k'+1}^k2^{-i}[t_i=c]\),這樣即可在 \(|T|·|\Sigma|\) 的時間內算出答案。

時間複雜度 \(\Theta((\sum|T|+n)·|\Sigma|)\)

const int MAXN=1e5;
const int MAXM=100;
const int MAXL=1e6;
const int BS=191;
const int MOD=1e9+7;
const int INV2=5e8+4;
const int HMOD=1004535809;
int n,qu,occ[MAXN+5][28],pw[MAXN+5],ipw[MAXN+5],pw_hs[MAXL+5];
char s[MAXM+5],t[MAXN+5];string str[22];
int getocc(string s,string t){
	static int hss[MAXL*2+5];int hst=0,res=0;
	for(int i=1;i<=s.size();i++) hss[i]=(1ll*hss[i-1]*BS+s[i-1])%HMOD;
	for(int i=0;i<t.size();i++) hst=(1ll*BS*hst+t[i])%HMOD;
	for(int i=0;i+t.size()<=s.size();i++)
		if((hss[i+t.size()]-1ll*pw_hs[t.size()]*hss[i]%HMOD+HMOD)%HMOD==hst)
			res++;
	return res;
}
int main(){
	scanf("%d%d%s%s",&n,&qu,s+1,t+1);
	for(int i=(pw[0]=ipw[0]=1);i<=MAXN;i++){
		ipw[i]=1ll*ipw[i-1]*INV2%MOD;
		pw[i]=(pw[i-1]<<1)%MOD;
	}
	for(int i=(pw_hs[0]=1);i<=MAXL;i++) pw_hs[i]=1ll*pw_hs[i-1]*BS%HMOD;
	for(int i=1;i<=n;i++){
		for(int j=0;j<26;j++) occ[i][j]=occ[i-1][j];
		occ[i][t[i]-'a']=(occ[i][t[i]-'a']+ipw[i])%MOD;
	}
	int len=strlen(s+1),cur=0;for(int i=1;i<=len;i++) str[0].pb(s[i]);
	while(str[cur].size()<=MAXL&&cur<n){
		cur++;
		for(int i=0;i<str[cur-1].size();i++) str[cur].pb(str[cur-1][i]);
		str[cur].pb(t[cur]);
		for(int i=0;i<str[cur-1].size();i++) str[cur].pb(str[cur-1][i]);
	}
	while(qu--){
		int k;string p;static char buf[MAXL+5];
		scanf("%d%s",&k,buf+1);int L=strlen(buf+1);
		for(int i=1;i<=L;i++) p.pb(buf[i]);
		int mx=0;while(str[mx].size()<=L) mx++;
		if(k<=mx){printf("%d\n",getocc(str[k],p));continue;}
		int res=1ll*getocc(str[mx],p)*pw[k-mx]%MOD;
		for(int i=0;i<26;i++){
			string nw_s;
			for(int j=str[mx].size()-L+1;j<str[mx].size();j++) nw_s.pb(str[mx][j]);
			nw_s.pb(i+'a');
			for(int j=0;j<L-1;j++) nw_s.pb(str[mx][j]);
			int msk=occ[k][i],cnt=getocc(nw_s,p);
//			printf("%d %d\n",msk,cnt);
//			cout<<nw_s<<" "<<p<<endl;
			for(int j=1;j<=mx;j++) if(t[j]-'a'==i) msk=(msk-ipw[j]+MOD)%MOD;
			res=(res+1ll*msk*pw[k]%MOD*cnt)%MOD;
		} printf("%d\n",res);
	}
	return 0;
}