1. 程式人生 > >後綴數組總結

後綴數組總結

source span mark math cpp pan n-k 代碼 做到

後綴數組總結

學習後綴數組可以參考2009年國家集訓隊論文《後綴數組——處理字符串的有力工具》BY羅穗騫
這裏只有代碼

const int N = 1e6+5;
char s[N];
int n,a[N],t[N],x[N],y[N],SA[N],Rank[N],Height[N],ans;
bool cmp(int i,int j,int k){return y[i]==y[j]&&y[i+k]==y[j+k];}
void getSA()
{
    int m=30;
    for (int i=1;i<=n;++i) ++t[x[i]=a[i]];
    for (int
i=1;i<=m;++i) t[i]+=t[i-1]; for (int i=n;i>=1;--i) SA[t[x[i]]--]=i; for (int k=1;k<=n;k<<=1) { int p=0; for (int i=0;i<=m;++i) y[i]=0; for (int i=n-k+1;i<=n;++i) y[++p]=i; for (int i=1;i<=n;++i) if (SA[i]>k) y[++p]=SA[i]-k; for
(int i=0;i<=m;++i) t[i]=0; for (int i=1;i<=n;++i) ++t[x[y[i]]]; for (int i=1;i<=m;++i) t[i]+=t[i-1]; for (int i=n;i>=1;--i) SA[t[x[y[i]]]--]=y[i]; swap(x,y); x[SA[1]]=p=1; for (int i=2;i<=n;++i) x[SA[i]]=cmp(SA[i],SA[i-1],k)?p:++p; if
(p>=n) break;m=p; } for (int i=1;i<=n;++i) Rank[SA[i]]=i; for (int i=1,j=0;i<=n;++i) { if (j) --j; while (a[i+j]==a[SA[Rank[i]-1]+j]) ++j; Height[Rank[i]]=j; } }

\(SA[i]\)表示字典序第\(i\)小的是哪一個後綴
\(Rank[i]\)表示後綴\(i\)是第幾小的,顯然和\(SA\)互為逆數組
\(Height[i]\)表示\(SA[i]\)\(SA[i-1]\)的最長公共前綴\((lcp)\)
通常可以對\(Height[i]\)維護一個\(ST\)表做到\(O(1)\)查詢任意兩個後綴的\(lcp\)

後綴數組總結