1. 程式人生 > >luogu P3809 【模板】字尾排序

luogu P3809 【模板】字尾排序

嘟嘟嘟


今天學了一個字尾陣列,還是挺好理解的。


因為我不會基數排序,所以只會\(O(n \log ^ 2 n)\)的sort版。
首先,字尾陣列就是把該字串的所有後綴按字典序排序得到的一個數組。注意這個排序只有字典序一個關鍵字,跟長度無關。
比如ababa的字尾陣列就是:5 3 1 4 2,對應的字尾為a, aba, ababa, ba, baba。


怎麼求呢?
特別好理解。
就像st表一樣倍增的求。
\(s[i][k]\)表示以\(i\)為起點,長度為\(2 ^ k\)的子串(如果\(i + 2 ^ k > n\),則表示從\(i\)開始的字尾)。\(rank_k[i]\)表示他是第幾小的。
那麼如果要比較\(s[i][k + 1]\)

\(s[j][k + 1]\),只需比較\(s[i][k], s[i + 2 ^ k][k]\)\(s[j][k], s[j + 2 ^ k][k]\)的排名。換句話說,這一次的排序。就是以\(rank[s[i][k]]\)為第一關鍵字,\(rank[s[i + 2 ^ k][k]]\)為第二關鍵字進行排序。
排完序後,再\(O(n)\)掃一遍更新\(rank\)陣列。
分治每一層為\(O(n \log n)\),一共\(\log n\)層,所以總複雜度為\(O(n \log ^ 2 n)\)

#include<cstdio>
#include<iostream>
#include<cmath>
#include<algorithm>
#include<cstring>
#include<cstdlib>
#include<cctype>
#include<vector>
#include<stack>
#include<queue>
using namespace std;
#define enter puts("") 
#define space putchar(' ')
#define Mem(a, x) memset(a, x, sizeof(a))
#define In inline
typedef long long ll;
typedef double db;
const int INF = 0x3f3f3f3f;
const db eps = 1e-8;
const int maxn = 1e6 + 5;
inline ll read()
{
  ll ans = 0;
  char ch = getchar(), last = ' ';
  while(!isdigit(ch)) last = ch, ch = getchar();
  while(isdigit(ch)) ans = (ans << 1) + (ans << 3) + ch - '0', ch = getchar();
  if(last == '-') ans = -ans;
  return ans;
}
inline void write(ll x)
{
  if(x < 0) x = -x, putchar('-');
  if(x >= 10) write(x / 10);
  putchar(x % 10 + '0');
}

int n, k;
char s[maxn];
int sa[maxn], rnk[maxn], tp[maxn];

In bool cmp(int i, int j)
{
  if(rnk[i] != rnk[j]) return rnk[i] < rnk[j];
  int x = i + k <= n ? rnk[i + k] : -1;
  int y = j + k <= n ? rnk[j + k] : -1;
  return x < y;
}

int main()
{
  scanf("%s", s + 1);
  n = strlen(s + 1);
  for(int i = 1; i <= n; ++i) sa[i] = i, rnk[i] = s[i];
  //剛開始的rank可以直接用ASCII碼
  for(k = 1; k <= n; k <<= 1)
    {
      sort(sa + 1, sa + n + 1, cmp);
      for(int i = 1; i <= n; ++i)
        tp[sa[i]] = tp[sa[i - 1]] + (cmp(sa[i - 1], sa[i]) ? 1 : 0);
      for(int i = 1; i <= n; ++i) rnk[i] = tp[i];
    }
  for(int i = 1; i <= n; ++i) write(sa[i]), space; enter;
  return 0;
}