hdu 5008 (字尾陣列 + rmq +二分)
阿新 • • 發佈:2019-02-02
題意:給出一個字串,求出第k小的子串,並求出字串的起止位置,如果有多個重複的子串,求出位置最靠左的子串。
思路:比賽時,想到了要用字尾陣列,但是沒想到如何做。
其實,因為子串是字尾的字首,字尾陣列對字尾排序的同時,也對子串進行了排序。對於每一個sa[i],會產生不同的n - sa[i] - height[i]個子串,這些子串也是排好序的。
這樣,我們就我們就可以二分求出這些子串中的第k小的子串。
但是,因為我們沒有考慮LCP,這樣會導致對於相同的第k小,有些位置更靠左,且存在於公共字首中的子串沒有考慮到,這樣,我們還需要對這些字串進行考慮。
那如何求出最靠左的子串呢?首先要注意,前面找到的子串是在sa陣列中,最先出現的子串,但不是在整個字串最先出現的子串。我們從找到該子串的sa的位置開始,向後搜尋,如果和該位置的LCP不小於找到子串的長度,那說明是可能的位置。因為,對於給定位置的LCP,他的長度是不增的,我們可以二分去找到整個可能的範圍。最後在這個區間求一次RMQ就是最左的位置。
注意的點:第一個sa[0] 是最後新增的0字元,因為那個最大,第二個點 無論是sa 還是 height 從1開始,因為0都是最後我們新增的0,所以不會有影響。還有就是一些小細節 sa的值是從0開始的。
#include <bits/stdc++.h>
using namespace std;
const int MAXN = 1e5+100;
int t1[MAXN],t2[MAXN],c[MAXN];
typedef long long ll;
ll tol[MAXN];
char s[MAXN];
bool cmp(int *r,int a,int b,int l)
{
return r[a]==r[b]&&r[a+l]==r[b+l];
}
void da(char str[],int sa[],int ra[],int height[],int n,int m)
{
n++;
int i,j,p,*x=t1,*y=t2;
for(i=0;i<m;i++) c[i]=0;
for(i=0;i<n;i++) c[x[i]=str[i]]++;
for(i=1;i<m;i++) c[i]+=c[i-1];
for(i=n-1;i>=0;i--) sa[--c[x[i]]]=i;
for (j=1;j<=n;j<<=1)
{
p=0;
for(i=n-j;i<n;i++) y[p++]=i;
for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;
for(i=0;i<m;i++) c[i]=0;
for(i=0;i<n;i++) c[x[y[i]]]++;
for(i=1;i<m;i++) c[i]+=c[i-1];
for(i=n-1;i>=0;i--) sa[--c[x[y[i]]]]=y[i];
swap(x,y);
p=1;x[sa[0]]=0;
for(i=1;i<n;i++)
x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
if(p>=n) break;
m=p;
}
int k=0;
n--;
for(i=0;i<=n;i++) ra[sa[i]]=i;
for(i=0;i<n;i++)
{
if(k) k--;
j=sa[ra[i]-1];
while(str[i+k]==str[j+k])k++;
height[ra[i]]=k;
}
}
int ra[MAXN],height[MAXN];
int sa[MAXN];
int f1[MAXN][22],f2[MAXN][22];
void init1(int n)
{
for(int i=1;i<=n;i++)
f1[i][0]=sa[i];
for(int j=1;(1<<j)<=n;j++)
{
for(int i=1;i+(1<<j)-1<=n;i++)
{
f1[i][j]=min(f1[i][j-1],f1[i+(1<<(j-1))][j-1]);
}
}
}
int rmq1(int i,int j)
{
int k=0;
while(1<<(k+1)<=(j-i+1)) k++;
return min(f1[i][k],f1[j-(1<<k)+1][k]);
}
void init2(int n)
{
for(int i=1;i<=n;i++)
f2[i][0]=height[i];
for(int j=1;(1<<j)<=n;j++)
{
for(int i=1;i+(1<<j)-1<=n;i++)
{
f2[i][j]=min(f2[i][j-1],f2[i+(1<<(j-1))][j-1]);
}
}
}
int rmq2(int i,int j)
{
int k=0;
while(1<<(k+1)<=(j-i+1)) k++;
return min(f2[i][k],f2[j-(1<<k)+1][k]);
}
int main()
{
while(~scanf(" %s",s))
{
int t;
scanf("%d",&t);
int len=strlen(s);
da(s,sa,ra,height,len,130);
int n=len;
for(int i=1;i<=n;i++)
tol[i]=tol[i-1]+n-sa[i]-height[i];
init1(len);
init2(len);
int lll=0,rrr=0;
int ans=0;
while(t--)
{
ll k;
scanf("%lld",&k);
k=(lll^rrr^k)+1;
if(k>tol[n])
{
lll=rrr=0;
puts("0 0");
continue;
}
int num=lower_bound(tol+1,tol+1+n,k)-tol;
k-=tol[num-1];
int st=sa[num];
int ed=sa[num]+height[num]+k-1;
int lenn=ed-st+1;
int l=num+1,r=n;
while(l<=r)
{
int mid=(l+r)>>1;
int pan=rmq2(num+1,mid);
if(pan>=lenn)
l=mid+1;
else r=mid-1;
}
if(r>=num+1)
ans=rmq1(num,r);
else ans=st;
lll=ans+1;
rrr=ans+lenn;
printf("%d %d\n",lll,rrr);
}
}
}