1. 程式人生 > >SP687 REPEATS - Repeats(字尾陣列)

SP687 REPEATS - Repeats(字尾陣列)

一個初步的想法是我們列舉重複子串的長度\(L\)。然後跑一遍SA。然後我們列舉一個點\(i\),令他的對應點為\(i+L\),然後求出這兩個點的LCP和LCS的長度答案就是這個點的答案就是\((len(LCP)+len(LCS)+L-1)/L\)。這個可以用跟\(EXKMP\)的類似的方法證明。
但是這樣會T。
那麼如何優化?我們在\(1,1+L,1+L*2...\)這些位置設定關鍵點(這個方法比較常見)。然後列舉每一個點改成每一個關鍵點。這樣為什麼會對?當我們對一個不是關鍵點的點求\(LCP\)\(LCS\)時。如果\(LCP\)\(LCS\)過關鍵點,那麼和從關鍵點求\(LCS\),和\(LCP\)

沒有區別。如果不過時,那麼這兩個串就不連在一起,對答案沒有貢獻。
設定了關鍵點之後,複雜度變成了調和級數級別。

#include<iostream>
#include<cstring>
#include<cstdio>
#include<cmath>
#include<algorithm>
using namespace std;
const int N=100100;
int ans,T,n;
struct SA{
    int c[N],x[N],y[N],m,sa[N],rk[N],height[N],mn[N][20];
    char s[N];
    void get_sa(){
        for(int i=1;i<=m;i++)c[i]=0;
        for(int i=1;i<=n;i++)c[x[i]=s[i]]++;
        for(int i=1;i<=m;i++)c[i]+=c[i-1];
        for(int i=n;i>=1;i--)sa[c[x[i]]--]=i;
        for(int k=1;k<=n;k<<=1){
            int num=0;
            for(int i=n-k+1;i<=n;i++)y[++num]=i;
            for(int i=1;i<=n;i++)if(sa[i]>k)y[++num]=sa[i]-k;
            for(int i=1;i<=m;i++)c[i]=0;
            for(int i=1;i<=n;i++)c[x[i]]++;
            for(int i=1;i<=m;i++)c[i]+=c[i-1];
            for(int i=n;i>=1;i--)sa[c[x[y[i]]]--]=y[i],y[i]=0;
            for(int i=1;i<=n;i++)swap(x[i],y[i]);
            x[sa[1]]=1;num=1;
            for(int i=2;i<=n;i++)
                x[sa[i]]=(y[sa[i]]==y[sa[i-1]]&&y[sa[i]+k]==y[sa[i-1]+k])?num:++num;
            if(n==num)break;
            m=num;
        }
    }
    void get_height(){
        int k=0;
        for(int i=1;i<=n;i++)rk[sa[i]]=i;
        for(int i=1;i<=n;i++){
            if(rk[i]==1)continue;
            if(k)k--;
            int j=sa[rk[i]-1];
            while(i+k<=n&&j+k<=n&&s[i+k]==s[j+k])k++;
            height[rk[i]]=k;
        }
    }
    void pre_work(){
        for(int i=1;i<=n;i++)mn[i][0]=height[i];
        int len=log2(n);
        for(int j=1;j<=len;j++)
            for(int i=1;i+(1<<j)-1<=n;i++)
                mn[i][j]=min(mn[i][j-1],mn[i+(1<<j-1)][j-1]);
    }
    int getlcp(int l,int r){
        if(l>r)swap(l,r);
        l++;
//      cout<<l<<" "<<r<<"aaaaa"<<endl; 
        int len=log2(r-l+1);    
        return min(mn[l][len],mn[r-(1<<len)+1][len]);
    }
}A,B;
int read(){
    int sum=0,f=1;char ch=getchar();
    while(ch<'0'||ch>'9'){if(ch=='-')f=-1;ch=getchar();}
    while(ch>='0'&&ch<='9'){sum=sum*10+ch-'0';ch=getchar();}
    return sum*f;
}
int main(){
    T=read();
    while(T--){
        n=read();
        ans=0;
        A.m=B.m=122;
        for(int i=1;i<=n;i++)cin>>A.s[i],B.s[n-i+1]=A.s[i];
        A.get_sa();A.get_height();A.pre_work();
        B.get_sa();B.get_height();B.pre_work();
        for(int i=1;i<=n;i++)
            for(int j=1;j+i<=n;j+=i)
                ans=max(ans,(A.getlcp(A.rk[j],A.rk[j+i])+B.getlcp(B.rk[n-j+1],B.rk[n-j-i+1])+i-1)/i);
        printf("%d\n",ans);
    }
    return 0;
}