[Hihocoder](1415)字尾陣列三·重複旋律3 ---- 字尾陣列(最長公共子串)
阿新 • • 發佈:2018-12-14
做法:
- 我們知道,字串中任意一個子串都是某個字尾的字首
- 我們也知道了Height陣列的含義是排名為i的字尾與排名i-1的字尾的最長公共字首,即就是最長公共子串。
- 現在題意讓我們找兩個串的最長公共子串,普通的KMP是無法解決這樣的匹配的問題,因為KMP是完全匹配,而本題可出現子串的匹配。
- 通過上述,我們發現,我們可以有這樣的思路,即將兩個串合成一個,求Height陣列,那Height陣列最大值豈不是ans? 思路是對的,但是要注意特殊情況。
- 比如原題中給的這種abab和a的這個樣例,我們如果求最大的Height,ans = 2,但正確的ans應該為1,因為第一個串abab中自己的Height陣列值,影響了答案。
- 兩個串合併為一個abab#a,我們只需要以#為界,保證Height陣列所代表的一組字尾來源於不同串即可。
AC程式碼:
#include <iostream>
#include <cstdio>
#include <cstring>
#include <algorithm>
#include <cmath>
#define IO ios_base::sync_with_stdio(0),cin.tie(0),cout.tie(0)
#define pb(x) push_back(x)
#define sz(x) (int)(x).size()
#define sc(x) scanf("%d",&x)
#define abs(x) ((x)<0 ? -(x) : x)
#define all(x) x.begin(),x.end()
#define mk(x,y) make_pair(x,y)
#define debug printf("!!!!!!\n")
#define fin freopen("in.txt","r",stdin)
#define fout freopen("out.txt","w",stdout)
using namespace std;
typedef long long ll;
typedef pair<int,int> PII;
const int mod = 1e9+7;
const double PI = 4*atan(1.0);
const int maxm = 1e6;
const int maxn =2e5+10;
const int INF = 0x3f3f3f3f;
const ll LINF = 1ll<<62;
const int m = 128; //
string s0,s1;
char s[maxn]; //待排序的字串放在s陣列中,從s[0~n-1],長度為n,且最大值小於m,最後一位是0(無效值)
int sa[maxn],t1[maxn],t2[maxn],c[maxn],n,pos; //sa[1~n]為有效值,sa[0]必定為n是無效值
int rk[maxn]; //rank[0~n-1]為有效值,rank[n]必定為0無效值
int height[maxn]; //height[0~n-1]
//lcp(x,y):字串x與字串y的最長公共字首,在這裡指x號字尾與與y號字尾的最長公共字首
//height[i]:lcp(sa[i],sa[i-1]),即排名為i的字尾與排名為i-1的字尾的最長公共字首
//H[i]:height[rak[i]],即i號字尾與它前一名的字尾的最長公共字首
void build_sa(int m)
{
n++;
int *x = t1,*y = t2;
for(int i=0;i<m;i++) c[i] = 0;
for(int i=0;i<n;i++) c[x[i] = s[i]]++;
for(int i=1;i<m;i++) c[i]+=c[i-1];
for(int i=n-1;i>=0;i--) sa[--c[x[i]]] = i;
for(int j=1;j<=n;j<<=1)
{
int p = 0;
for(int i = n-j;i<n;i++) y[p++] = i;
for(int i=0;i<n;i++) if(sa[i]>=j) y[p++] = sa[i]-j;
for(int i=0;i<m;i++) c[i] = 0;
for(int i=0;i<n;i++) c[x[y[i]]]++;
for(int i=1;i<m;i++) c[i]+=c[i-1];
for(int i=n-1;i>=0;i--) sa[--c[x[y[i]]]] = y[i];
swap(x,y);
p = 1;x[sa[0]] = 0;
for(int i=1;i<n;i++)
x[sa[i]] = (y[sa[i-1]] == y[sa[i]] && y[sa[i-1]+j] == y[sa[i]+j])?p-1:p++;
if(p>=n) break;
m = p;
}
n--;
int k = 0;
for(int i=0;i<=n;i++) rk[sa[i]] = i;
for(int i=0;i<n;i++){
if(k) k--;
int j = sa[rk[i]-1];
while(s[i+k] == s[j+k]) k++;
height[rk[i]] = k;
}
}
void solve()
{
int ans = -1;
for(int i=1;i<=n;i++)
{
if((sa[i]<=pos && sa[i-1]>pos) || (sa[i]>pos && sa[i-1]<=pos)) //兩種情況都有可能
ans = max(ans,height[i]);
}
cout<<ans<<endl;
}
int main()
{
// fin;
IO;
cin>>s0>>s1;
pos = s0.length();
// cout<<pos<<endl;
s0 +="#"+s1;
// cout<<s0<<endl;
n = s0.length();
strcpy(s,s0.c_str());
build_sa(m);
// for(int i=1;i<=n;i++) cout<<sa[i]<<" ";
// cout<<endl;
solve();
return 0;
}