108 字尾陣列(SA)
阿新 • • 發佈:2022-04-16
視訊連結:
#include <iostream> #include <cstring> #include <algorithm> using namespace std; const int N = 1000010; int n, m = 122; //把z的ASC碼122,作為桶個數的初始值 char s[N]; int sa[N], c[N], x[N], y[N]; int height[N], rk[N]; void get_sa(){ // 把字尾按第一個字母排序--sa[] for (inti = 1; i <= m; i++) c[i] = 0; // 清空桶 for (int i = 1; i <= n; i++) c[x[i] = s[i]] ++; for (int i = 2; i <= m; i++) c[i] += c[i-1]; for (int i = n; i; i -- ) sa[c[x[i]] --] = i; for (int k = 1; k <= n; k <<= 1) { // 迴圈logn輪 // 把字尾按第二關鍵字排序--y[] int p = 0;for(int i = n-k+1; i <= n; i++) y[++p] = i; for(int i = 1; i <= n; i++) if(sa[i] > k) y[++ p] = sa[i]-k; // 字尾sa[i]是字尾sa[i]-k的第二關鍵字 // 把字尾按雙關鍵字排序--sa[] for(int i=1; i <= m; i++) c[i] = 0; for(int i=1; i <= n; i++) c[x[i]] ++;for(int i=2; i <= m; i++) c[i] += c[i-1]; for(int i=n; i; i--) sa[c[x[y[i]]]--] = y[i]; // 字尾y[i]--桶號x[]--排名c[]--生成sa[] // 把字尾按雙關鍵字放入桶--x[] swap(x, y); x[sa[1]] = 1, p = 1; for (int i = 2; i <= n; i++) x[sa[i]]= (y[sa[i]]==y[sa[i-1]] &&y[sa[i]+k]==y[sa[i-1]+k])?p:++p; m = p; //更新桶的個數 if(m == n) break; //桶數等於字尾數,說明已排好 } } void get_height(){ for(int i = 1; i <= n; i++) rk[sa[i]] = i; for(int i=1, k=0; i <= n; i++){ //列舉字尾i if(rk[i] == 1) continue; //第一名height為0 if(k) k--; //上一個字尾的height值減1 int j = sa[rk[i]-1]; //找出字尾i的前鄰字尾j while(i+k<=n && j+k<=n && s[i+k]==s[j+k])k++; height[rk[i]] = k; // printf("i=%d j=%d h[rk[%d]]=%d\n",i,j,i,k); } } int main(){ scanf("%s", s+1); n = strlen(s+1); get_sa(); get_height(); for(int i=1; i<=n; i++) printf("%d ", sa[i]); puts(""); for(int i=1; i<=n; i++) printf("%d ", height[i]); return 0; }