1. 程式人生 > >Longest Common Substring II(字尾自動機)

Longest Common Substring II(字尾自動機)

題目描述

傳送門
題意:給出若干串,求最長公共子串。

題解

這明明就是一道sa的題嘛,可是為了練習sam用sam來寫
首先對於第一個串構建sam
對於每一個狀態s,記錄一下它對於每一個串(除了第一個串)的最長匹配長度
對於某一個狀態s,如果除第一個串之外的串匹配到此所得的最長長度是a1,a2,a3...an1,那麼這個狀態的最長公共子串應為min{a1,a2,a3...an1,step(s)}
和只有兩個串相同的是,一旦需要在pre指標上蹦,蹦到的節點最長匹配長度應該為step
和只有兩個串不同的是,如果當前點匹配到了,它的pre指標指向的點也能匹配到,並且匹配的長度是step,由於是要取min,這道題需要在最後按照拓撲序更新一下
我寫了兩種方法,一是建出parent樹來然後在樹上dfs,二是直接基排也就是按照step從大到小的順序更新一下

程式碼

#include<iostream>
#include<cstring>
#include<cstdio>
using namespace std;
#define N 200005

char s[N];
int n,p,np,q,nq,root,sz,last,inf,ans;
int ch[N][30],pre[N],step[N],Max[N],Min[N];
int tot,point[N],nxt[N],v[N];

void extend()
{
    for (int i=0;i<n;++i)
    {
        int
x=s[i]-'a'; p=last;np=++sz;last=np; step[np]=step[p]+1; while (p&&!ch[p][x]) { ch[p][x]=np; p=pre[p]; } if (!p) pre[np]=root; else { q=ch[p][x]; if (step[q]==step[p]+1) pre[np]=q; else
{ nq=++sz; step[nq]=step[p]+1; memcpy(ch[nq],ch[q],sizeof(ch[q])); pre[nq]=pre[q]; pre[np]=pre[q]=nq; while (ch[p][x]==q) { ch[p][x]=nq; p=pre[p]; } } } } } void add(int x,int y) { ++tot; nxt[tot]=point[x]; point[x]=tot; v[tot]=y; } void dfs(int x) { for (int i=point[x];i;i=nxt[i]) { dfs(v[i]); if (Max[v[i]]) Max[x]=step[x]; } } void sam() { int len=0;p=root; memset(Max,0,sizeof(Max)); for (int i=0;i<n;++i) { int x=s[i]-'a'; if (ch[p][x]) p=ch[p][x],++len; else { while (p&&!ch[p][x]) p=pre[p]; if (!p) p=root,len=0; else { len=step[p]+1; p=ch[p][x]; } } Max[p]=max(Max[p],len); } dfs(1); for (int i=1;i<=sz;++i) Min[i]=min(Min[i],Max[i]); } int main() { gets(s);n=strlen(s); root=last=++sz; extend(); for (int i=1;i<=sz;++i) add(pre[i],i); memset(Min,127,sizeof(Min));inf=Min[0]; while (~scanf("%s",s)) { n=strlen(s); sam(); } for (int i=1;i<=sz;++i) if (Min[i]!=inf) ans=max(ans,Min[i]); printf("%d\n",ans); }
#include<iostream>
#include<cstring>
#include<cstdio>
using namespace std;
#define N 200005

char s[N];
int n,p,np,q,nq,root,sz,last,inf,ans;
int ch[N][30],pre[N],step[N],Max[N],Min[N],pt[N],c[N];

void extend()
{
    for (int i=0;i<n;++i)
    {
        int x=s[i]-'a';
        p=last;np=++sz;last=np;
        step[np]=step[p]+1;
        while (p&&!ch[p][x])
        {
            ch[p][x]=np;
            p=pre[p];
        }
        if (!p) pre[np]=root;
        else
        {
            q=ch[p][x];
            if (step[q]==step[p]+1) pre[np]=q;
            else
            {
                nq=++sz;
                step[nq]=step[p]+1;
                memcpy(ch[nq],ch[q],sizeof(ch[q]));
                pre[nq]=pre[q];
                pre[np]=pre[q]=nq;
                while (ch[p][x]==q)
                {
                    ch[p][x]=nq;
                    p=pre[p];
                }
            }
        }
    }
}
void sam()
{
    int len=0;p=root;
    memset(Max,0,sizeof(Max));
    for (int i=0;i<n;++i)
    {
        int x=s[i]-'a';
        if (ch[p][x])
            p=ch[p][x],++len;
        else
        {
            while (p&&!ch[p][x]) p=pre[p];
            if (!p) p=root,len=0;
            else
            {
                len=step[p]+1;
                p=ch[p][x];
            }
        }
        Max[p]=max(Max[p],len);
    }
    for (int i=sz;i>=1;--i)
    {
        p=pt[i];
        if (Max[p]) Max[pre[p]]=step[pre[p]];
    }
    for (int i=1;i<=sz;++i)
        Min[i]=min(Min[i],Max[i]);
}
int main()
{
    gets(s);n=strlen(s);
    root=last=++sz;
    extend();
    for (int i=1;i<=sz;++i) ++c[step[i]];
    for (int i=1;i<=sz;++i) c[i]+=c[i-1];
    for (int i=sz;i>=1;--i) pt[c[step[i]]--]=i;
    memset(Min,127,sizeof(Min));inf=Min[0];
    while (~scanf("%s",s))
    {
        n=strlen(s);
        sam();
    }
    for (int i=1;i<=sz;++i)
        if (Min[i]!=inf) ans=max(ans,Min[i]);
    printf("%d\n",ans);
}