1. 程式人生 > >POJ - 1743 後綴數組 height分組

POJ - 1743 後綴數組 height分組

二分 定義 amp 空隙 答案 void turn query 差值

題意:求最長不可重疊的相同差值子串的長度

這道題算是拖了好幾個月,現在花了點時間應該搞懂了不少,嘗試分析一下

我們首先來解決一個退化的版本,求最長不可重疊的相同子串(差值為0)
比如\(aabaabaa\), 那麽所求的子串有\(aab,aba,baa\)三個
如何求?不妨枚舉.枚舉是否有長度為\(k\)的最長不可重疊相同子串
可是後綴數組中並不能直接表示出子串,只能間接地用後綴來表示
長度為\(k\)的相同子串\(=>\)最大公共前綴長度為\(k\)的子串\(=>\)最大公共前綴長度大於等於\(k\)的後綴(註意非充要)
而我們所求的就是一個\(lcp\),我們應該分組,每一組內的各個後綴的\(lcp\)

都大於等於\(k\),由\(lcp\)定義可轉化為組內按\(sa\)排序\(height\)不得小於\(k\)
按照這個規則我們來看下上面的實例如何分組,這是枚舉\(k=3\)時的情況
index=8 height[1]=0 \(a\)
-----
index=7 height[2]=1 \(aa\)
-----
index=4 height[3]=2 \(aabaa\)
index=1 height[4]=5 \(aabaabaa\)
-----
index=5 height[5]=1 \(abaa\)
index=2 height[6]=4 \(abaabaa\)
-----
index=6 height[7]=0 \(baa\)

index=3 height[8]=3 \(baabaa\)
-----
我們註意到按照這樣排序是沒辦法知道兩個子串是否重疊,所以需要記錄\(index\)
其中\(index\)是指該後綴首字符在字符串中的位置(1為首),也就是\(sa[i]\)
那麽我們現在就有辦法去搞了,因為每一組都保證了\(lcp>=k\),也就是如果重疊也算的話,每一組都是合法的分組(主要組內後綴個數大於1)
現在因為只有不可重疊才是合法條件所以需要剔除非法的後綴,既然有了\(sa\)值那就好辦,如果組內任意兩個後綴的\(index\)\(i,j\),那就需要\(i_{max}-j_{min}>=k\)
,表示該組至少有一對符合條件
至此,枚舉\(k=3\)的情況為真,得到的分組按順序恰有\(aab,aba,baa\)三個,其他情況依次類推二分下去就好

現在再來看原來的問題:求最長相同的差值的不可重疊子串,輸出該長度
既然要相同的差值,我們把原串\(n\)個字符(值)轉化為\(n-1\)個值的差分數組
同樣枚舉最長的相同值的不可重疊子串,如果能枚舉出最大的\(k\)是成立的,那答案還原回來就是\(k+1\)
但是,需要註意的是對於\(index\),應該要滿足\(i_{max}-j_{min}>k\),因為差分數組是必須要留出"空隙"的,否則遇到臨界情況就是兩個不可重疊子串恰好相連,而這個是差分子串,還原回來就是中間的值恰好被兩個原串重復選取了,這也是條件輕微更改的原因
不過這道題的數據應該是隨機生成的,即使不改也會AC
樓教主的題真的好勁啊

#include<iostream>
#include<algorithm>
#include<cstdio>
#include<cstring>
#include<cstdlib>
#include<cmath>
#include<string>
#include<vector>
#include<stack>
#include<queue>
#include<set>
#include<map>
#define rep(i,j,k) for(register int i=j;i<=k;i++)
#define rrep(i,j,k) for(register int i=j;i>=k;i--)
#define erep(i,u) for(register int i=head[u];~i;i=nxt[i])
#define iin(a) scanf("%d",&a)
#define lin(a) scanf("%lld",&a)
#define din(a) scanf("%lf",&a)
#define s0(a) scanf("%s",a)
#define s1(a) scanf("%s",a+1)
#define print(a) printf("%lld",(ll)a)
#define enter putchar(‘\n‘)
#define blank putchar(‘ ‘)
#define println(a) printf("%lld\n",(ll)a)
#define IOS ios::sync_with_stdio(0)
using namespace std;
const int maxn = 1e6+11;
const int oo = 0x3f3f3f3f;
const double eps = 1e-7;
typedef long long ll;
ll read(){
    ll x=0,f=1;register char ch=getchar();
    while(ch<‘0‘||ch>‘9‘){if(ch==‘-‘)f=-1;ch=getchar();}
    while(ch>=‘0‘&&ch<=‘9‘){x=x*10+ch-‘0‘;ch=getchar();}
    return x*f;
}
int str[maxn],n;
struct SA{
    int Rank[maxn],sa[maxn],tsa[maxn],A[maxn],B[maxn];
    int cntA[maxn],cntB[maxn];
    int height[maxn],best[maxn][30],n;//height[i]:第sa[i]與sa[i-1]的cp 
    void get(int nn){
        n=nn; 
        rep(i,0,666) cntA[i]=0;
        rep(i,1,n) cntA[str[i]]++;
        rep(i,1,666) cntA[i]+=cntA[i-1];
        rrep(i,n,1) sa[cntA[str[i]]--]=i;
        Rank[sa[1]]=1;
        rep(i,2,n){
            if(str[sa[i]]==str[sa[i-1]]){
                Rank[sa[i]]=Rank[sa[i-1]];
            }else{
                Rank[sa[i]]=1+Rank[sa[i-1]];
            }
        }
        for(int l=1;Rank[sa[n]]<n;l<<=1){
            rep(i,1,n) cntA[i]=cntB[i]=0;
            rep(i,1,n) cntA[A[i]=Rank[i]]++;
            rep(i,1,n) cntB[B[i]=(i+l<=n?Rank[i+l]:0)]++;
            rep(i,1,n) cntA[i]+=cntA[i-1],cntB[i]+=cntB[i-1];
            rrep(i,n,1) tsa[cntB[B[i]]--]=i;
            rrep(i,n,1) sa[cntA[A[tsa[i]]]--]=tsa[i];
            Rank[sa[1]]=1;
            rep(i,2,n){
                bool flag=A[sa[i]]==A[sa[i-1]]&&B[sa[i]]==B[sa[i-1]];
                flag=!flag;
                Rank[sa[i]]=Rank[sa[i-1]]+flag;
            }
        }
    }
    void ht(){
        int j=0;
        rep(i,1,n){
            if(j) j--;
            while(str[i+j]==str[sa[Rank[i]-1]+j]) j++;
            height[Rank[i]]=j;
        }
    }
    void rmq(){
        rep(i,1,n) best[i][0]=height[i];
        for(int i=1;(1<<i)<=n;i++){
            for(int j=1;j+(1<<i)-1<=n;j++){
                best[j][i]=min(best[j][i],best[j+(1<<(i-1))][i-1]);
            }
        }
    }
    int query(int l,int r){
        if(l==r)return -oo;
        if(l>r)swap(l,r);
        l++;
        int k=log2(r-l+1);
        return min(best[l][k],best[r-(1<<k)+1][k]);
    }
}sa;

bool check(int k){
    int mx=-oo,mn=oo;
    for(int i=2;i<=n;i++){
        if(sa.height[i]>=k){
            mx=max(mx,max(sa.sa[i],sa.sa[i-1]));
            mn=min(mn,min(sa.sa[i],sa.sa[i-1]));
            if(mx-mn>k)return 1;
        }else{
            mx=-oo;mn=oo;
        }
    }
    return 0;
}
int main(){
    while(scanf("%d",&n),n){
        rep(i,1,n) str[i]=read();
        if(n<5){
            printf("0\n");
            continue;
        }
        rep(i,1,n) str[i]=str[i+1]-str[i]+100;
        str[n]=0;n--;
        sa.get(n);
        sa.ht();
        int l=0,r=n,mid,ans=0;
        while(l<=r){
            mid=(l+r)>>1;
            if(check(mid)) l=mid+1,ans=mid;
            else r=mid-1;
        }
        if(ans+1>=5) println((ans+1));
        else println(0);
    }
    return 0;
}

POJ - 1743 後綴數組 height分組