1. 程式人生 > 實用技巧 >CF204E-Little Elephant and Strings【廣義SAM,線段樹合併】

CF204E-Little Elephant and Strings【廣義SAM,線段樹合併】

正題

題目連結:https://www.luogu.com.cn/problem/CF204E


題目大意

\(n\)個字串的一個字串集合,對於每個字串求有多少個子串是這個字串集合中至少\(k\)個字串的子串。


解題思路

因為對於每個字串我們需要維護的資訊不同,不能累加,所以考慮使用線段樹合併。

先將\(n\)個字串構建出一個廣義\(SAM\),然後對於每個節點維護一個該線段樹表示該節點屬於的字串。然後在\(parents\)樹上從下往上合併,如果屬於字串的數量多餘\(k\),那麼打上標記。

然後再上往下走,每個節點產生的答案就是在它\(parents\)樹上的祖先中最近的一個打了標記的節點的\(len\)

時間複雜度\(O(n\log n)\)

好像還可以先接起來跑一遍\(SA\),然後用單調佇列類似於統計矩形面積一樣的方法來做,也是\(O(n\log n)\)當然我這裡寫的是\(SAM\)


\(code\)

#include<cstdio>
#include<cstring>
#include<algorithm>
#include<vector>
using namespace std;
const int N=2e5+10;
struct node{
    int to,next;
}a[N<<1];
int n,k,cnt,tot,ls[N],rt[N];
int ch[N][26],fa[N],len[N];
bool mark[N];char s[N];
long long ans[N];
vector<int> q[N];
struct Seq_Tree{
    int w[N<<4],ls[N<<4],rs[N<<4],cnt;
    int Change(int x,int L,int R,int pos,int val){
        int y=++cnt;
        if(L==R){w[y]=val;return y;}
        int mid=(L+R)>>1;
        if(pos<=mid)ls[y]=Change(ls[x],L,mid,pos,val),rs[y]=rs[x];
        else ls[y]=ls[x],rs[y]=Change(rs[x],mid+1,R,pos,val);
        w[y]=w[ls[y]]+w[rs[y]];return y;
    }
    int Ask(int x,int L,int R,int pos){
        if(!x)return 0;
        if(L==R)return w[x];
        int mid=(L+R)>>1;
        if(pos<=mid)return Ask(ls[x],L,mid,pos);
        return Ask(rs[x],mid+1,R,pos);
    }
    int Merge(int x,int y,int L,int R){
        if((!x)||(!y))return x|y;
        if(L==R){w[x]=w[x]|w[y];return x;}
        int mid=(L+R)>>1;
        ls[x]=Merge(ls[x],ls[y],L,mid);
        rs[x]=Merge(rs[x],rs[y],mid+1,R);
        w[x]=w[ls[x]]+w[rs[x]];
        return x;
    }
}T;
void addl(int x,int y){
    a[++tot].to=y;
    a[tot].next=ls[x];
    ls[x]=tot;return;
}
int Insert(int c,int p){
    if(ch[p][c]){
        int q=ch[p][c];
        if(len[q]==len[p]+1)return q;
        int nq=++cnt;len[nq]=len[p]+1;
        memcpy(ch[nq],ch[q],sizeof(ch[nq]));
        fa[nq]=fa[q];fa[q]=nq;
        for(;p&&ch[p][c]==q;p=fa[p])ch[p][c]=nq;
        return nq;
    }
    int np=++cnt;len[np]=len[p]+1;
    for(;p&&!ch[p][c];p=fa[p])ch[p][c]=np;
    if(!p)fa[np]=1;
    else{
        int q=ch[p][c];
        if(len[q]==len[p]+1)fa[np]=q;
        else{
            int nq=++cnt;len[nq]=len[p]+1;
            memcpy(ch[nq],ch[q],sizeof(ch[nq]));
            fa[nq]=fa[q];fa[q]=fa[np]=nq;
            for(;p&&ch[p][c]==q;p=fa[p])ch[p][c]=nq;
        }
    }
    return np;
}
void dfs(int x){
    for(int i=ls[x];i;i=a[i].next){
        int y=a[i].to;
        dfs(y);
        rt[x]=T.Merge(rt[x],rt[y],1,n);
    }
    if(T.w[rt[x]]>=k)mark[x]=1;
    return;
}
void solve(int x,int res){
    if(mark[x])res=len[x];
    for(int i=ls[x];i;i=a[i].next){
        int y=a[i].to;
        solve(y,res);
    }
    for(int i=0;i<q[x].size();i++)
        ans[q[x][i]]+=res;
    return;
}
int main()
{
    scanf("%d%d",&n,&k);cnt=1;
    for(int i=1;i<=n;i++){
        scanf("%s",s);
        int l=strlen(s),last=1;
        for(int j=0;j<l;j++){
            last=Insert(s[j]-'a',last);
            rt[last]=T.Change(rt[last],1,n,i,1);
            q[last].push_back(i);
        }
    }
    for(int i=2;i<=cnt;i++)addl(fa[i],i);
    dfs(1);solve(1,0);
    for(int i=1;i<=n;i++)
        printf("%lld\n",ans[i]);
    return 0;
}