1. 程式人生 > 其它 >108 字尾陣列(SA)

108 字尾陣列(SA)

視訊連結:

 

 

 

 

 

 

 

 

 

 

 

 

#include <iostream>
#include <cstring>
#include <algorithm>
using namespace std;

const int N = 1000010;
int n, m = 122; //把z的ASC碼122,作為桶個數的初始值
char s[N];
int sa[N], c[N], x[N], y[N];
int height[N], rk[N];

void get_sa(){
    // 把字尾按第一個字母排序--sa[]
    for (int
i = 1; i <= m; i++) c[i] = 0; // 清空桶 for (int i = 1; i <= n; i++) c[x[i] = s[i]] ++; for (int i = 2; i <= m; i++) c[i] += c[i-1]; for (int i = n; i; i -- ) sa[c[x[i]] --] = i; for (int k = 1; k <= n; k <<= 1) { // 迴圈logn輪 // 把字尾按第二關鍵字排序--y[] int p = 0;
for(int i = n-k+1; i <= n; i++) y[++p] = i; for(int i = 1; i <= n; i++) if(sa[i] > k) y[++ p] = sa[i]-k; // 字尾sa[i]是字尾sa[i]-k的第二關鍵字 // 把字尾按雙關鍵字排序--sa[] for(int i=1; i <= m; i++) c[i] = 0; for(int i=1; i <= n; i++) c[x[i]] ++;
for(int i=2; i <= m; i++) c[i] += c[i-1]; for(int i=n; i; i--) sa[c[x[y[i]]]--] = y[i]; // 字尾y[i]--桶號x[]--排名c[]--生成sa[] // 把字尾按雙關鍵字放入桶--x[] swap(x, y); x[sa[1]] = 1, p = 1; for (int i = 2; i <= n; i++) x[sa[i]]= (y[sa[i]]==y[sa[i-1]] &&y[sa[i]+k]==y[sa[i-1]+k])?p:++p; m = p; //更新桶的個數 if(m == n) break; //桶數等於字尾數,說明已排好 } } void get_height(){ for(int i = 1; i <= n; i++) rk[sa[i]] = i; for(int i=1, k=0; i <= n; i++){ //列舉字尾i if(rk[i] == 1) continue; //第一名height為0 if(k) k--; //上一個字尾的height值減1 int j = sa[rk[i]-1]; //找出字尾i的前鄰字尾j while(i+k<=n && j+k<=n && s[i+k]==s[j+k])k++; height[rk[i]] = k; // printf("i=%d j=%d h[rk[%d]]=%d\n",i,j,i,k); } } int main(){ scanf("%s", s+1); n = strlen(s+1); get_sa(); get_height(); for(int i=1; i<=n; i++) printf("%d ", sa[i]); puts(""); for(int i=1; i<=n; i++) printf("%d ", height[i]); return 0; }