1. 程式人生 > >【模板】字尾排序

【模板】字尾排序

模板題

學習字尾陣列的基礎就是字尾排序啦
先說一下變數:
最重要的兩個 s a r k sa和rk 陣列:
s

a [ i ] i
sa[i]表示排名為i的位置
r k [ i ]
i rk[i]表示位置i的字尾的排名

s a [ r k [ i ] ] = r k [ s a [ i ] ] = i sa[rk[i]]=rk[sa[i]]=i
輔助變數:
t a x tax 就是桶, t p tp 就是第二關鍵字,也用作 r k rk 的備份

字尾排序的實現就是:倍增+基數排序
基數排序又叫桶排序,簡單說就是按照權值分配到桶裡去完成排序

倍增一個長度,然後把這個長度的字尾接到上一個這麼長的字尾後面,前面的是第一關鍵字,後面的就是第二關鍵字,桶排序按第一關鍵字,然後倒序列舉第二關鍵字就可以求出當前 s a sa
倍增直到每個位置的排名都不一樣的時候就停止。
複雜度大概 O ( n l o g n ) O(nlogn)?

模擬過程可以看一眼這個圖(盜來的):
在這裡插入圖片描述

最後程式碼實現:

注意這裡的 m m 是權值的範圍

#include<iostream>
#include<cstdio>
#include<algorithm>
#include<cstring>
#include<cmath>
#define N 1000005
using namespace std;
char s[N];
int n,m,sa[N],rk[N],tp[N],tax[N];

void rsort(){
	for(int i=1;i<=m;i++) tax[i]=0;
	for(int i=1;i<=n;i++) ++tax[rk[i]];//加入桶 
	for(int i=1;i<=m;i++) tax[i]+=tax[i-1];//求字首 
	for(int i=n;i;i--) sa[tax[rk[tp[i]]]--]=tp[i];//倒序按第二關鍵字排序 
}

void ssort(){
	for(int i=1;i<=n;i++) rk[i]=s[i],tp[i]=i;
	rsort();//長度為1 
	for(int w=1,p=0;p<n && w<=n;m=p,w<<=1){
		p=0;//w為長度,p為計數器 
		for(int i=n-w+1;i<=n;i++) tp[++p]=i;//n-w+1~n,第二關鍵字最小 
		for(int i=1;i<=n;i++)
			if(sa[i]>w) tp[++p]=sa[i]-w;//要在一個字尾後面接一個字尾 
		rsort(); 
		swap(rk,tp);//備份 
		rk[sa[1]]=p=1;
		for(int i=2;i<=n;i++){
			if(tp[sa[i]]==tp[sa[i-1]] && tp[min(n+1,sa[i]+w)]==tp[min(n+1,sa[i-1]+w)])
				rk[sa[i]]=p;//如果第一關鍵字和第二關鍵字都和上一個一樣 
			else rk[sa[i]]=++p;
		}
	}
}

int main(){
	scanf("%s",s+1); n=strlen(s+1); m=127;
	ssort();
	for(int i=1;i<=n;i++) printf("%d ",sa[i]);
	return 0; 
}