基於Rank的並查集優化

阿新 • • 發佈：2019-01-11

在上一小節中，我們討論了基於Size的並查集優化方法，即在合併兩個集合時，通過判斷兩個集合元素的數量大小來決定把哪一個集合併入另一個集合當中，從而減少了因為合併集合使得合併後樹的層數增多的情況，因此執行find操作所需的步驟數量也大大減少了。但是，沒有絕對完美的優化方法，這種基於Size的合併策略在有的時候卻並不能很好的解決合併時發生層數增多的問題，例如下面這種情況：

我們可以看到，如果我們現在需要把4和2兩個元素合併在一起，即把他們各自的集合合併為同一個集合，2的根元素為7,4的根元素為8，且7為根的集合的樹所含有的元素個數為6個，而以8為根的集合所含有的元素個數為3個，根據Size的策略，我們會把8節點的父親指標指向7根節點來合併這兩個集合。如下圖所示：

然而，經過這樣歸併後，這棵樹的層數就由原來的兩層變成了四層，如果我們換一個方向去合併這兩個集合，把7根節點的父親指標指向8根節點的話來合併這兩個集合，樹形就如下圖所示：

我們發現，原來以8作為根節點的樹的層數為3層，現在合併後的集合的層數還是3層，這樣合併後的集合的層數也要比上面的4層少一層，因此我們可以得出這樣的一個結論：僅僅依靠集合的Size來判斷由誰指向誰，並不是完全準確的，更準確的是比較集合的層數來判斷誰指向誰，這樣最後合併出來的集合的層數能夠竟可能的壓縮至最小，因此執行find操作的效率將大大提高。在集合中，層數越少，對於每一個節點平均來說，找到根節點所需要查詢的次數就會越小。

因此，我們可以用一個rank陣列來替換原來的Size陣列,Rank[i]表示以 i 為根節點的集合的層數，即樹的高度。下面我們來看一下具體的實現程式碼：

並查集的基礎結構：

 private:
        int* parent;//parent指標指向一個專門用來記錄元素父親元素的指標
        int count;//記錄集合中元素的數量
        int *rank;//rank[i]表示以i為根的集合的層數

建構函式：

 UnionFind4(int n){
            parent=new int[n];//初始化parent陣列
            rank=new int[n];//rank[i]表示以i為根元素的集合所表示的樹的層數
            count=n;
            /*
             * 切記一定要記得初始化parent陣列
             * 使每個元素的parent指標都指向自己
             */
            for(int i=0;i<n;i++){
                parent[i]=i;
                rank[i]=1;//最開始所有的元素都指向自己，每一個元素都是根元素，每一個集合都只有一層
            }

        }

接下來是最重要的連線操作：

對於兩個集合來說，如果兩個集合的層數不一樣，我們只需要把層數小的集合的根元素的父親節點指向另一個集合的根元素就好了，而且最後合併出來的集合的層數是不變的。還是以下圖為例：

根據rank的策略，根節點7元素的父親節點指向了8元素，然而合併後的集合的層數原來為3層（8,3,4集合），7節點的集合與其合併後，合併後的集合的層數仍然為3層，是不會變的。

合併後集合層數唯一會變的情況，就是兩個集合的層數一模一樣時。我們可以這樣去理解，假設兩個集合都只有一個元素，那麼這兩個集合的層數都為一層，層數相同時，此時誰的根節點的父親節點指向另一個根節點都無所謂了，但是這樣合併後的集合層數要比原來多了一層。（原來兩個集合都為一層，合併後的集合就變成兩層了），因此，Unionelements的程式碼具體如下：

  //合併兩個元素所在的集合
        void unoinelements(int p,int q){
            int proot=find(p);//找出p元素位於的集合的根元素
            int qroot=find(q);//找出q元素位於的結合的根元素
            if(proot==qroot){//如果兩個元素的根元素都為同一個元素，則它們已經在同一個集合當中了
                return;
            }
            else{//兩個元素在不同的集合當中
                if(rank[proot]<rank[qroot]) {//p元素所在的集合的層數小於q元素所在的集合的層數
                    parent[proot] = qroot;//p集合的根節點父親指標指向q集合的根節點
                }
                else if(rank[proot]>rank[qroot]){//此時p集合的層數要大於q集合的層數
                    parent[qroot]=proot;//q集合的根元素的父親節點指向p集合的根元素
                }
                else{//p集合與q集合的層數相同
                    parent[proot]=qroot;//二者根元素任意連線都可，這裡預設把p集合的根元素父親節點指向q集合的根節點
                    rank[qroot]++;//q集合的層數此時會增加一層
                }
            }
        }

我們接下來在檢驗一下基於Rank優化的並查集的效率如何，同樣是進行200萬次的操作：

int main() {
        int n=1000000;
        UnionFindTestHelper::TestUF1(n);
        UnionFindTestHelper::TestUF2(n);
        UnionFindTestHelper::TestUF3(n);
        UnionFindTestHelper::TestUF4(n);
    return 0;
}

結果如下：

我們發現，基於Rank的優化策略效率同樣很高，但是有的時候可能會比基於Size優化策略的並查集慢一些，這是因為基於Rank優化的並查集的Unionelements操作中的if else判斷語句更多了，因此要比Size慢一點，但是效率仍然很高，還可以克服一些極端的情況，因此實現並查集使用rank策略就好了。

如需獲取本次版本的所有原始碼，請點選此處移步我的Github程式碼倉庫。

基於Rank的並查集優化

基於Rank的並查集優化

HDU 1198 Farm Irrigation （並查集優化，構圖）

POJ 1456 Supermarket(貪心演算法，可用並查集優化)

『最小生成樹』Kruskal演算法——加邊法（並查集優化 + C++語言編寫 + 例題）

並查集優化連邊

hdu1811 Rank of Tetris 並查集+拓撲排序

HDU 1811 Rank of Tetris（並查集+拓撲排序非常經典）

Rank of Tetris 並查集+拓撲排序★★

【HDU 1811】 Rank of Tetris 並查集+拓撲

資料結構（十一）並查集的實現和優化

HDU 1811 Rank of Tetris（並查集+拓撲排序）

並查集的實現與優化

並查集及其簡單應用：優化kruskal演算法

最小生成樹kruskal演算法（貪心+並查集+堆優化）

Rank HDU - 1704（藉由本題說明並查集與傳遞閉包的區別）

並查集--演算法，優化，變種

並查集的兩種優化(按秩合併，路徑壓縮)

並查集的優化---路徑壓縮與啟發式合併

基於並查集+Kruskal演算法的matlab程式及最小生成樹繪圖

牛客練習賽39 D 動態連通塊+並查集 X bitset 優化

基於Rank的並查集優化

相關推薦