Codeforces 1466G - Song of the Sirens(雜湊)
阿新 • • 發佈:2021-10-19
比較有意思的雜湊
,而這樣的出現位置要麼在 \(s_0\) 中出現過,要麼在某個 \(s_{k'}(k'<k)\) 中作為跨過中間的 \(t_{k'}\) 的字串出現。因此
\[res=\text{occ}(t_0,T)·2^k+\sum\limits_{i=1}^k\text{occ}(s_{i}[|s_{i}|-|T|+2,|s_{i}|]+t_i+s_{i}[1,|T|-1],T)·2^{k-i}
\] 或 \(k'>k\) 則直接輸出 \(\text{occ}(t_k,T)\) 即可。否則我們先令答案加上 \(\text{occ}(t_{k'},T)·2^{k-k'}\),而對於 \(i>k',j>k'\),由於 \(|T|<|s_i|,|T|<|s_j|\),如果 \(t_i=t_j\),那麼顯然有 \(s_{i}[|s_{i}|-|T|+2,|s_{i}|]+t_i+s_{i}[1,|T|-1]=s_{j}[|s_{j}|-|T|+2,|s_{j}|]+t_j+s_{j}[1,|T|-1]\),我們考慮列舉所有 \(t_j=c\),計算 \(\text{occ}(s_{i}[|s_{i-1}|-|T|+2,|s_{i}|]+c+s_{i}[1,|T|-1],T)\) ,然後字首和求出 \(\sum\limits_{i=k'+1}^k2^{-i}[t_i=c]\),這樣即可在 \(|T|·|\Sigma|\) 的時間內算出答案。
事實證明,有的難度評分不算很高、涉及的知識點不算很難的題目也能出得非常神仙
首先考慮如何暴力求答案。注意到一個文字串 \(T\) 在 \(s_k\) 中出現的位置,有兩種可能,要麼跨過中間的 \(t_k\),要麼沒跨過,前者等價於文字串在 \(s_{k-1}[|s_{k-1}|-|T|+2,|s_{k-1}|]+t_k+s_{k-1}[1,|T|-1]\) 中出現的次數。由於其長度為 \(\mathcal O(|T|)\),因此可以在 KMP 或雜湊在 \(\mathcal O(|T|)\) 時間內求出。要麼沒有跨過中間的 \(t_k\)
其中 \(\text{occ}(s,t)\) 表示 \(t\) 在 \(s\) 中的出現次數。
考慮優化。我們找到最小的 \(k'\),滿足 \(|t_{k'}|>|T|\),如果不存在這樣的 \(k'\)
時間複雜度 \(\Theta((\sum|T|+n)·|\Sigma|)\)
const int MAXN=1e5;
const int MAXM=100;
const int MAXL=1e6;
const int BS=191;
const int MOD=1e9+7;
const int INV2=5e8+4;
const int HMOD=1004535809;
int n,qu,occ[MAXN+5][28],pw[MAXN+5],ipw[MAXN+5],pw_hs[MAXL+5];
char s[MAXM+5],t[MAXN+5];string str[22];
int getocc(string s,string t){
static int hss[MAXL*2+5];int hst=0,res=0;
for(int i=1;i<=s.size();i++) hss[i]=(1ll*hss[i-1]*BS+s[i-1])%HMOD;
for(int i=0;i<t.size();i++) hst=(1ll*BS*hst+t[i])%HMOD;
for(int i=0;i+t.size()<=s.size();i++)
if((hss[i+t.size()]-1ll*pw_hs[t.size()]*hss[i]%HMOD+HMOD)%HMOD==hst)
res++;
return res;
}
int main(){
scanf("%d%d%s%s",&n,&qu,s+1,t+1);
for(int i=(pw[0]=ipw[0]=1);i<=MAXN;i++){
ipw[i]=1ll*ipw[i-1]*INV2%MOD;
pw[i]=(pw[i-1]<<1)%MOD;
}
for(int i=(pw_hs[0]=1);i<=MAXL;i++) pw_hs[i]=1ll*pw_hs[i-1]*BS%HMOD;
for(int i=1;i<=n;i++){
for(int j=0;j<26;j++) occ[i][j]=occ[i-1][j];
occ[i][t[i]-'a']=(occ[i][t[i]-'a']+ipw[i])%MOD;
}
int len=strlen(s+1),cur=0;for(int i=1;i<=len;i++) str[0].pb(s[i]);
while(str[cur].size()<=MAXL&&cur<n){
cur++;
for(int i=0;i<str[cur-1].size();i++) str[cur].pb(str[cur-1][i]);
str[cur].pb(t[cur]);
for(int i=0;i<str[cur-1].size();i++) str[cur].pb(str[cur-1][i]);
}
while(qu--){
int k;string p;static char buf[MAXL+5];
scanf("%d%s",&k,buf+1);int L=strlen(buf+1);
for(int i=1;i<=L;i++) p.pb(buf[i]);
int mx=0;while(str[mx].size()<=L) mx++;
if(k<=mx){printf("%d\n",getocc(str[k],p));continue;}
int res=1ll*getocc(str[mx],p)*pw[k-mx]%MOD;
for(int i=0;i<26;i++){
string nw_s;
for(int j=str[mx].size()-L+1;j<str[mx].size();j++) nw_s.pb(str[mx][j]);
nw_s.pb(i+'a');
for(int j=0;j<L-1;j++) nw_s.pb(str[mx][j]);
int msk=occ[k][i],cnt=getocc(nw_s,p);
// printf("%d %d\n",msk,cnt);
// cout<<nw_s<<" "<<p<<endl;
for(int j=1;j<=mx;j++) if(t[j]-'a'==i) msk=(msk-ipw[j]+MOD)%MOD;
res=(res+1ll*msk*pw[k]%MOD*cnt)%MOD;
} printf("%d\n",res);
}
return 0;
}