[POJ1743]Musical Theme(字尾陣列||字尾自動機)
阿新 • • 發佈:2019-01-10
題目描述
傳送門
題意:給出一個序列,問重複出現兩次的、不重疊的、長度至少為5的子串長度最大是多少。注意這裡的“重複出現”指的是趨勢相同,即1,2,3,4,5和11,12,13,14,15是相同的,重複出現的。
題解
以為是趨勢相同,所以做個差然後加個base,就變成了長度至少為4的一模一樣的兩個子串。
用height搞事情。。。
某個子串一定是一個字尾的字首。
兩個字尾的最長公共字首是在 height 陣列上的區間最小值。
先二分答案,把題目變成判定性問題:判斷是否存在兩個長度為mid的子串是相同的,且不重疊。把排序後的字尾分成若干組,其中每組的字尾之間的 height 值都不小於 k 。有希望成為最長公共字首不小於 k 的兩個字尾一定在同一組。 然後對於每組字尾,只須判斷每個字尾的 sa 值的最大值和最小值之差是否不小於 k 。如果有一組滿足,則說明存在,否則不存在。
如下圖所示。
摘自集訓隊論文 。
UPD-2017.3.29
學習了一下sam,然後又用sam寫了一發
主要還是利用字尾自動機的性質
首先同樣是做差,然後建立字尾自動機
然後,對於某一個點s的right集合,處理出right集合中最靠左的點和最靠右的點,如果這兩個點的距離不小於Min(s),就說明是有合法的不重疊的子串的
對於最靠左和最靠右的點可以按照拓撲序在parent樹上由兒子到父親更新過來,初始時主鏈上的點的左右端點都是step,因為其表示了原串的一個字首,對於一個點的Min的計算即為step(pre(s))+1
程式碼
sa
#include<iostream>
#include<cstring>
#include<cstdio>
using namespace std;
#define N 20005
#define base 100
int n,m;
int s[N],*x,*y,X[N],Y[N],c[N];
int sa[N],height[N],rank[N];
void clear()
{
m=200;
memset(s,0,sizeof(s));memset(X,0,sizeof(X));memset(Y,0,sizeof(Y));memset(c,0,sizeof(c));
memset(height,0,sizeof (height));memset(sa,0,sizeof(sa));memset(rank,0,sizeof(rank));
}
void build_sa()
{
x=X,y=Y;
for (int i=0;i<m;++i) c[i]=0;
for (int i=0;i<n;++i) ++c[x[i]=s[i]];
for (int i=1;i<m;++i) c[i]+=c[i-1];
for (int i=n-1;i>=0;--i) sa[--c[x[i]]]=i;
for (int k=1;k<=n;k<<=1)
{
int p=0;
for (int i=n-k;i<n;++i) y[p++]=i;
for (int i=0;i<n;++i) if (sa[i]>=k) y[p++]=sa[i]-k;
for (int i=0;i<m;++i) c[i]=0;
for (int i=0;i<n;++i) ++c[x[y[i]]];
for (int i=1;i<m;++i) c[i]+=c[i-1];
for (int i=n-1;i>=0;--i) sa[--c[x[y[i]]]]=y[i];
swap(x,y);p=1,x[sa[0]]=0;
for (int i=1;i<n;++i)
x[sa[i]]=y[sa[i-1]]==y[sa[i]]&&((sa[i-1]+k>=n?-1:y[sa[i-1]+k])==(sa[i]+k>=n?-1:y[sa[i]+k]))?p-1:p++;
if (p>n) break;
m=p;
}
}
void build_height()
{
for (int i=0;i<n;++i) rank[sa[i]]=i;
int k=0;height[0]=0;
for (int i=0;i<n;++i)
{
if (!rank[i]) continue;
if (k) --k;
int j=sa[rank[i]-1];
while (i+k<n&&j+k<n&&s[i+k]==s[j+k]) ++k;
height[rank[i]]=k;
}
}
bool check(int mid)
{
int Max=-1,Min=n;
for (int i=1;i<n;++i)
{
if (height[i]<mid)
{
if (Max-Min>=mid) return true;
Max=-1,Min=n;
}
else
{
Max=max(Max,sa[i]);
Min=min(Min,sa[i]);
Max=max(Max,sa[i-1]);
Min=min(Min,sa[i-1]);
}
}
if (Max-Min>=mid) return true;
else return false;
}
int find()
{
int l=4,r=n,mid,ans=-1;
while (l<=r)
{
mid=(l+r)>>1;
if (check(mid)) ans=mid,l=mid+1;
else r=mid-1;
}
return ans;
}
int main()
{
while (~scanf("%d",&n))
{
if (!n) break;
clear();
for (int i=0;i<n;++i) scanf("%d",&s[i]);
for (int i=1;i<n;++i) s[i-1]=s[i]-s[i-1]+base;
--n;
build_sa();
build_height();
int ans=find();
printf("%d\n",ans+1);
}
}
sam
#include<algorithm>
#include<cstring>
#include<cstdio>
using namespace std;
#define N 40003
#define base 87
int n,root,sz,last,p,np,q,nq,ans;
int a[N],c[N],mn[N],mx[N],ch[N][175],pre[N],step[N],pt[N];
void clear()
{
root=sz=last=p=np=q=nq=ans=0;
memset(a,0,sizeof(a));
memset(c,0,sizeof(c));
memset(ch,0,sizeof(ch));
memset(pt,0,sizeof(pt));
memset(pre,0,sizeof(pre));
memset(step,0,sizeof(step));
}
void extend(int x)
{
p=last;np=++sz;last=np;
step[np]=step[p]+1;
while (p&&!ch[p][x])
{
ch[p][x]=np;
p=pre[p];
}
if (!p) pre[np]=root;
else
{
q=ch[p][x];
if (step[q]==step[p]+1) pre[np]=q;
else
{
nq=++sz;
step[nq]=step[p]+1;
memcpy(ch[nq],ch[q],sizeof(ch[q]));
pre[nq]=pre[q];
while (p&&ch[p][x]==q)
{
ch[p][x]=nq;
p=pre[p];
}
pre[np]=pre[q]=nq;
}
}
}
int main()
{
while (~scanf("%d",&n))
{
if (!n) break;
clear();
for (int i=1;i<=n;++i) scanf("%d",&a[i]);
root=last=++sz;
for (int i=2;i<=n;++i) extend(a[i-1]=a[i]-a[i-1]+base);
for (int i=1;i<=sz;++i) ++c[step[i]];
for (int i=1;i<=sz;++i) c[i]+=c[i-1];
for (int i=sz;i>=1;--i) pt[c[step[i]]--]=i;
p=root;memset(mx,0,sizeof(mx));memset(mn,127,sizeof(mn));
for (int i=1;i<n;++i)
p=ch[p][a[i]],mx[p]=mn[p]=step[p];
for (int i=sz;i>=1;--i)
{
p=pt[i];
mx[pre[p]]=max(mx[pre[p]],mx[p]);
mn[pre[p]]=min(mn[pre[p]],mn[p]);
}
for (int i=1;i<=sz;++i)
if (mx[i]-mn[i]>=step[pre[i]]+1)
ans=max(ans,min(step[i],mx[i]-mn[i]));
if (ans<4) puts("0");
else printf("%d\n",ans+1);
}
}