1. 程式人生 > 實用技巧 >貪心演算法(一)——區間排程問題

貪心演算法(一)——區間排程問題

什麼是貪心演算法呢?貪心演算法可以認為是動態規劃演算法的一個特例,相比動態規劃,使用貪心演算法需要滿足更多的條件(貪心選擇性質),但是效率比動態規劃要高。

比如說一個演算法問題使用暴力解法需要指數級時間,如果能使用動態規劃消除重疊子問題,就可以降到多項式級別的時間,如果滿足貪心選擇性質,那麼可以進一步降低時間複雜度,達到線性級別的。

貪心演算法需要滿足:

  • 貪心選擇性

    選擇的貪心策略必須無後效性,即某個狀態以前的過程不會影響以後的狀態看,只與當前狀態有關。

    適用條件:區域性最優解能生成全域性最優解。

  • 最優子結構

什麼是貪心選擇性質呢,簡單說就是:每一步都做出一個區域性最優的選擇,最終的結果就是全域性最優。注意哦,這是一種特殊性質,其實只有一小部分問題擁有這個性質。

比如你面前放著 100 張人民幣,你只能拿十張,怎麼才能拿最多的面額?顯然每次選擇剩下鈔票中面值最大的一張,最後你的選擇一定是最優的。

然而,大部分問題都明顯不具有貪心選擇性質。比如打鬥地主,對手出對兒三,按照貪心策略,你應該出盡可能小的牌剛好壓制住對方,但現實情況我們甚至可能會出王炸。這種情況就不能用貪心演算法,而得使用動態規劃解決,參見前文 動態規劃解決博弈問題

一、問題概述

言歸正傳,本文解決一個很經典的貪心演算法問題 Interval Scheduling(區間排程問題)。給你很多形如[start,end]的閉區間,請你設計一個演算法,算出這些區間中最多有幾個互不相交的區間

int intervalScheduling(int[][] ints) {}

舉個例子,intvs=[[1,3],[2,4],[3,6]],這些區間最多有兩個區間互不相交,即[[1,3],[3,6]],你的演算法應該返回 2。注意邊界相同並不算相交。

這個問題在生活中的應用廣泛,比如你今天有好幾個活動,每個活動都可以用區間[start,end]表示開始和結束的時間,請問你今天****最多能參加幾個活動呢?

二、貪心解法

這個問題有許多看起來不錯的解決思路,實際上都不能得到正確答案。比如說:

也許我們可以每次選擇可選區間中開始最早的那個?但是可能存在某些區間開始很早,但是很長,使得我們錯誤地錯過了一些短的區間。

或者我們每次選擇可選區間中最短的那個?或者選擇出現衝突最少的那個區間?這些方案都能很容易舉出反例,不是正確的方案。

正確的思路其實很簡單,可以分為以下三步:

  1. 從區間集合 intvs 中選擇一個區間 x,這個 x 是在當前所有區間中結束最早的(end 最小)。
  2. 把所有與 x 區間相交的區間從區間集合 intvs 中刪除。
  3. 重複步驟 1 和 2,直到 intvs 為空為止。之前選出的那些 x 就是最大不相交子集。

把這個思路實現成演算法的話,可以按每個區間的end數值升序排序,因為這樣處理之後實現步驟 1 和步驟 2 都方便很多:

現在來實現演算法,對於步驟 1,由於我們預先按照end排了序,所以選擇 x 是很容易的。關鍵在於,如何去除與 x 相交的區間,選擇下一輪迴圈的 x 呢?

由於我們事先排了序,不難發現所有與 x 相交的區間必然會與 x 的end相交;如果一個區間不想與 x 的end相交,它的start必須要大於(或等於)x 的end

下面看下程式碼:

static bool Less(vector<int> a,vector<int> b)
    {
        return a[1]<b[1];
    }
    int IntervalsNoOverlap(vector<vector<int>>& intervals)
    {
        if(intervals.size()==0) return 0;
        sort(intervals.begin(),intervals.end(),Less);
        int end = intervals[0][1];
        int count = 1;
        for(vector<int> interval:intervals)
        {
            if(interval[0]>=end)
            {
                count++;
                end = interval[1];
            }
        }
        return count;
    }

三、應用舉例

下面舉例幾道 LeetCode 題目應用一下區間排程演算法。

第 435 題,無重疊區間:

我們已經會求最多有幾個區間不會重疊了,那麼剩下的不就是至少需要去除的區間嗎?

int eraseOverlapIntervals(int[][] intervals) {
    int n = intervals.length;
    return n - intervalSchedule(intervals);
}

第 452 題,用最少的箭頭射爆氣球:

其實稍微思考一下,這個問題和區間排程演算法一模一樣!如果最多有n個不重疊的區間,那麼就至少需要n個箭頭穿透所有區間:

只是有一點不一樣,在intervalSchedule演算法中,如果兩個區間的邊界觸碰,不算重疊;而按照這道題目的描述,箭頭如果碰到氣球的邊界氣球也會爆炸,所以說相當於區間的邊界觸碰也算重疊:

所以只要將之前的演算法稍作修改,就是這道題目的答案:

int findMinArrowShots(int[][] intvs) {
    // ...

    for (int[] interval : intvs) {
        int start = interval[0];
        // 把 >= 改成 > 就行了
        if (start > x_end) {
            count++;
            x_end = interval[1];
        }
    }
    return count;
}

這麼做的原因也不難理解,因為現在邊界接觸也算重疊,所以start == x_end時不能更新區間 x。