1. 程式人生 > >快速查詢區間最值——RMQ演算法(ST實現)

快速查詢區間最值——RMQ演算法(ST實現)

  1. 概述
    RMQ(Range Minimum/Maximum Query),即區間最值查詢,是指這樣一個問題:對於長度為n的數列A,回答若干詢問RMQ(A,i,j)(i,j<=n),返回數列A中下標在i,j之間的最小/大值。這兩個問題是在實際應用中經常遇到的問題,下面介紹一下解決這兩種問題的比較高效的演算法。當然,該問題也可以用線段樹(也叫區間樹)解決,演算法複雜度為:O(N)~O(logN),這裡我們暫不介紹。

  2. RMQ演算法
    對於該問題,最容易想到的解決方案是遍歷,複雜度是O(n)。但當資料量非常大且查詢很頻繁時,該演算法無法在有效的時間內查詢出正解。
    本節介紹了一種比較高效的線上演算法(ST演算法)解決這個問題。所謂線上演算法,是指使用者每輸入一個查詢便馬上處理一個查詢。該演算法一般用較長的時間做預處理,待資訊充足以後便可以用較少的時間回答每個查詢。ST(Sparse Table)演算法是一個非常有名的線上處理RMQ問題的演算法,它可以在O(nlogn)時間內進行預處理,然後在O(1)時間內回答每個查詢。

    (一)首先是預處理,用動態規劃(DP)解決。
    設A[i]是要求區間最值的數列,F[i, j]表示從第i個數起連續2^j個數中的最大值。(DP的狀態)
    例如:
    A數列為:3 2 4 5 6 8 1 2 9 7
    F[1,0]表示第1個數起,長度為2^0=1的最大值,其實就是3這個數。同理 F[1,1] = max(3,2) = 3, F[1,2]=max(3,2,4,5) = 5,F[1,3] = max(3,2,4,5,6,8,1,2) = 8;
    並且我們可以容易的看出F[i,0]就等於A[i]。(DP的初始值)
    這樣,DP的狀態、初值都已經有了,剩下的就是狀態轉移方程。
    我們把F[i,j]平均分成兩段(因為f[i,j]一定是偶數個數字),從 i 到i + 2 ^ (j - 1) - 1為一段,i + 2 ^ (j - 1)到i + 2 ^ j - 1為一段(長度都為2 ^ (j - 1))。用上例說明,當i=1,j=3時就是3,2,4,5 和 6,8,1,2這兩段。F[i,j]就是這兩段各自最大值中的最大值。於是我們得到了狀態轉移方程F[i, j]=max(F[i,j-1], F[i + 2^(j-1),j-1])。
    程式碼如下:

void RMQ(int num) //預處理->O(nlogn)
{
    for(int j = 1; j < 20; ++j)
        for(int i = 1; i <= num; ++i)
            if(i + (1 << j) - 1 <= num)
            {
                maxsum[i][j] = max(maxsum[i][j - 1], maxsum[i + (1 << (j - 1))][j - 1]);
                minsum[i][j] = min
(minsum[i][j - 1], minsum[i + (1 << (j - 1))][j - 1]); } }

這裡我們需要注意的是迴圈的順序,我們發現外層是j,內層所i,這是為什麼呢?可以是i在外,j在內嗎?

答案是不可以。因為我們需要理解這個狀態轉移方程的意義。
狀態轉移方程的含義是:先更新所有長度為F[i,0]即1個元素,然後通過2個1個元素的最值,獲得所有長度為F[i,1]即2個元素的最值,然後再通過2個2個元素的最值,獲得所有長度為F[i,2]即4個元素的最值,以此類推更新所有長度的最值。
而如果是i在外,j在內的話,我們更新的順序就是F[1,0],F[1,1],F[1,2],F[1,3],表示更新從1開始1個元素,2個元素,4個元素,8個元素(A[0],A[1],….A[7])的最值,這裡F[1,3] = max(max(A[0],A[1],A[2],A[3]),max(A[4],A[5],A[6],A[7]))的值,但是我們根本沒有計算max(A[0],A[1],A[2],A[3])和max(A[4],A[5],A[6],A[7]),所以這樣的方法肯定是錯誤的。

為了避免這樣的錯誤,一定要好好理解這個狀態轉移方程所代表的含義。

(二)然後是查詢。
假如我們需要查詢的區間為(i,j),那麼我們需要找到覆蓋這個閉區間(左邊界取i,右邊界取j)的最小冪(可以重複,比如查詢5,6,7,8,9,我們可以查詢5678和6789)。
因為這個區間的長度為j - i + 1,所以我們可以取k=log2( j - i + 1),則有:RMQ(A, i, j)=max{F[i , k], F[ j - 2 ^ k + 1, k]}。
舉例說明,要求區間[2,8]的最大值,k = log2(8 - 2 + 1)= 2,即求max(F[2, 2],F[8 - 2 ^ 2 + 1, 2]) = max(F[2, 2],F[5, 2]);

在這裡我們也需要注意一個地方,就是<<運算子和+-運算子的優先順序。
比如這個表示式:5 - 1 << 2是多少?

答案是:4 * 2 * 2 = 16。所以我們要寫成5 - (1 << 2)才是5-1 * 2 * 2 = 1。

以題目為例
連結

#include<cstdio>
#include<algorithm>
#include<cmath>
using namespace std;

const int N = 100010;
int maxsum[N][20], minsum[N][20];

void RMQ(int num) //預處理->O(nlogn)
{
    for(int j = 1; j < 20; ++j)
        for(int i = 1; i <= num; ++i)
            if(i + (1 << j) - 1 <= num)
            {
                maxsum[i][j] = max(maxsum[i][j - 1], maxsum[i + (1 << (j - 1))][j - 1]);
                minsum[i][j] = min(minsum[i][j - 1], minsum[i + (1 << (j - 1))][j - 1]);
            }
}

int main()
{
    int num, query;
    int src, des;
    scanf("%d %d", &num, &query);
        for(int i = 1; i <= num; ++i) //輸入資訊處理
        {
            scanf("%d", &maxsum[i][0]);
            minsum[i][0] = maxsum[i][0];
        }
        RMQ(num);
        while(query--) //O(1)查詢
        {
            scanf("%d %d", &src, &des);
            int k = (int)(log(des - src + 1.0) / log(2.0));
            int maxres = max(maxsum[src][k], maxsum[des - (1 << k) + 1][k]);
            int minres = min(minsum[src][k], minsum[des - (1 << k) + 1][k]);
            printf("%d\n", maxres - minres);
        }
    return 0;
}