1. 程式人生 > 其它 >DTOJ #1166 不相同的子串的個數

DTOJ #1166 不相同的子串的個數

技術標籤:c++

題目

給定一個字串,求不相同的子串的個數。

資料範圍

1 ≤ T ≤ 10 1 \leq T \leq 10 1T10,字串長度 ≤ 5 × 1 0 5 \leq 5 \times 10^5 5×105

題解

考慮到字串所有後綴的字首,所以我們只要把新增的 n + 1 − s a [ i ] n+1-sa[i] n+1sa[i]個字首,減去 h e i g h t [ i ] height[i] height[i]個相同的字首即可。

程式碼

#include<bits/stdc++.h>
using namespace std;
const int N=5e5+10;
int n,m,ht[N],sa[N],r[N],fir[N],sec[N],sum[N];
char c[N];
long long ans;
void get_sa(){
	for(int i=1;i<=n;++i)++sum[fir[i]=c[i]];
	for(int i=1;i<=m;++i)sum[i]+=sum[i-1];
	for(int i=n;i;--i)sa[sum[fir[i]]--]=i;
	for(int k=1;k<=n;k<<=1){int tot=0;
		for(int i=n-k+1;i<=n;++i)sec[++tot]=i;
		for(int i=1;i<=n;++i)if(sa[i]>k)sec[++tot]=sa[i]-k;
		for(int i=1;i<=m;++i)sum[i]=0;
		for(int i=1;i<=n;++i)++sum[fir[i]];
		for(int i=1;i<=m;++i)sum[i]+=sum[i-1];
		for(int i=n;i;--i)sa[sum[fir[sec[i]]]--]=sec[i],sec[i]=0;
		swap(fir,sec);
		int cnt=1;fir[sa[1]]=1;
		for(int i=2;i<=n;++i)
			fir[sa[i]]=(sec[sa[i]]==sec[sa[i-1]]&&sec[sa[i]+k]==sec[sa[i-1]+k])? cnt : ++cnt;
		if(cnt==n)break;
		m=cnt;
	}
	for(int i=1;i<=n;++i)r[sa[i]]=i;
}
void get_h(){int k=0,j;
	for(int i=1;i<=n;++i){j=sa[r[i]-1];if(k)--k;while(c[i+k]==c[j+k])++k;ht[r[i]]=k;}
}
int main(){int T;
	scanf("%d",&T);
	while(T--){
	memset(sum,0,sizeof(sum));ans=0;
	scanf("%s",c+1);
	n=strlen(c+1);m=200;
	get_sa();get_h();
	for(int i=1;i<=n;++i)ans+=n+1-sa[i]-ht[i];
	printf("%lld\n",ans);}
	return 0;
}