並查集：集合合併與元素查詢

阿新 • • 發佈：2018-11-06

博主按：因為教程所示圖片使用的是 github 倉庫圖片，網速過慢的朋友請移步《並查集：集合合併與元素查詢》原文地址。更歡迎來我的小站看更多原創內容：godbmw.com，進行“姿勢”交流 ♪(^∇*)

1. 什麼時候需要並查集？

在一些有 N 個元素的集合應用問題中，我們通常是在開始時讓每個元素構成一個單元素的集合，然後按一定順序將屬於同一組的元素所在的集合合併，其間要反覆查詢一個元素在哪個集合中。

這個過程就涉及到：“合併”和“查詢”這兩個操作。

利用並查集，可以實現用陣列儲存資料，並且查詢操作和合並操作的時間複雜度近乎 $O$

( 1 ) O(1) $O (1)$ 。

2. 如何實現並查集？

2.1 實現查詢操作

並查集是一種樹形資料結構。在這些資料中，每個集合是一棵樹，所有的集合在一起就形成了“森林”。

當然，之前說過要節省空間，藉助陣列就可以實現。為了方便說明，這裡陣列的索引值就是資料本身，而索引 i 對應的陣列的值arr[i]

就是i的根節點。

如下圖所示。3、4、9 這三個元素都以 8 位根節點。此時判斷兩個元素是否屬於同一集合，只需要遞迴找到元素的根節點，比較根節點是否相同即可。

2.2 實現合併操作

這裡的“合併”是指：將兩個元素所在的集合合併為一個集合。

這一步操作實現邏輯較複雜，假設有兩個元素 p 和 q 需要合併到一個集合，思路如下：

查詢 p 和 q 的根節點，如果相同，兩個元素已經是同一集合，跳出程式。如果不相同，往下執行。
將其中一個根節點的重新指向另一個跟節點，完成集合合併操作。

3. 演算法分析和優化

前面已經說了，“並查集”是一種樹形資料結構。而我們的查詢和合並操作其實都是建立在從葉節點向上遞迴查詢根節點的操作上。

因此，“並查集”的時間複雜度和樹的深度有關，下面的優化操作也是為了讓樹的深度儘可能少，甚至變成 1 或者 2 層。

3.1 合併優化

如2.2所陳述，這步操作： “將其中一個根節點的重新指向另一個跟節點，完成集合合併操作” ，其實可能會造成樹的高度增加。例如下圖兩棵樹：

如果是右邊那棵樹的根節點指向了左邊樹的根節點，那麼，新形成的樹的高度就是 4。然而，左邊那棵樹的根節點如果指向右邊那棵樹的跟節點，樹的高度就是 3。如此一來，形成的樹的高度更低。

優化的方法就是：在“合併操作”的更改根節點指向的這步中，檢測兩棵樹的高度，將高度較低的那顆樹指向高度較高的樹的根節點。所以，在初始化的時候，需要多一個數組rank[]，用來記錄以 i 為根節點的樹的高度。

3.2 “路徑壓縮”

大名鼎鼎的路徑壓縮，就是在“查詢”的過程中，將樹的高度壓縮成 2 層。如果對元素p呼叫了一次查詢操作，那麼以p為葉子節點的往上一直到根節點的所有節點，都會被壓縮。

如下圖所示，在執行find(4)操作後，整棵樹的樣子就變成了圖右邊的樣子。

程式碼的實現，需要藉助遞迴，請直接看find()方法。

4. 程式碼實現

關於並查集的資料結構封裝在了標頭檔案union_find.h中：

// union_find.h
// Created by godbmw.com on 2018/10/9.
//

#ifndef UNIONFIND_UNION_FIND_H
#define UNIONFIND_UNION_FIND_H

#include <iostream>
#include <cassert>

using namespace std;

class UnionFind {
private:
    int count;
//    parent[i]：元素i父節點的索引值
    int *parent;
//     rank[i]：以i為根的集合所表示的樹的層數
    int *rank;
public:
    UnionFind(int count) {
        this->count = count;
        parent = new int[count];
        rank = new int[count];
//        每個節點都是獨立的，所以父節點索引就是自己
//        每個節點的樹的高度都是1
        for(int i = 0; i < count; i++) {
            parent[i] = i;
            rank[i] = 1;
        }
    }

    ~UnionFind() {
        delete[] parent;
        delete[] rank;
    }

//    查詢索引為p的元素的根節點的索引
    int find(int p) {
//        路徑壓縮：將層數為n( n>1 )的樹壓縮為層數為1的樹
        if( p != this->parent[p]) {
            this->parent[p] = this->find( this->parent[p] );
        }
        return parent[p];
    }

//    檢視索引分別為p和q的元素是否屬於同一集合
    bool is_connected(int p, int q) {
        return this->find(p) == this->find(q);
    }

//    合併索引分別p和q的元素到一個集合
    void union_elements(int p, int q) {
        int p_root = this->find(p), q_root = this->find(q);

//        根節點索引值相同：已經屬於同一集合
        if(p_root == q_root) return ;

        if( this->rank[p_root] < this->rank[q_root] ) {
//            合併後，q_root 的樹的深度並沒有改變
            this->parent[p_root] = q_root;
        } else if ( this->rank[q_root] < this->rank[p_root] ) {
//            合併後，p_root 的樹的深度並沒有改變
            this->parent[q_root] = p_root;
        } else {
//            合併後，q_root 的深度加 1
            this->parent[p_root] = q_root;
            this->rank[q_root] += 1;
        }
    }
};

#endif //UNIONFIND_UNION_FIND_H

5. 程式碼測試

直接上了 1 億的資料量，並且執行了 1 一次合併操作和 1 億次檢查是否屬於同一集合的操作。在我的電腦上耗時基本是 8s。有圖有真相：

測試程式碼main.cpp如下：

// main.cpp
// created by godbmw.com

#include <iostream>
#include <ctime>
#include "union_find.h"

#define N 100000000

using namespace std;

void calc_run_time() {
    srand(time(NULL));
    register int a, b;
    UnionFind uf = UnionFind(N);

    time_t start_time = clock();

    for(int i = 0; i < N; i++) {
        a = rand() % N;
        b = rand() % N;
        uf.union_elements(a, b);
    }

    for(int i = 0; i < N; i++) {
        a = rand() % N;
        b = rand() % N;
        uf.is_connected(a, b);
    }

    time_t end_time = clock();

    cout << double(end_time - start_time) / CLOCKS_PER_SEC<<" s"<<endl;
}

int main() {
    calc_run_time();

    return 0;
}

並查集：集合合併與元素查詢

博主按：因為教程所示圖片使用的是 github 倉庫圖片，網速過慢的朋友請移步《並查集：集合合併與元素查詢》原文地址。更歡迎來我的小站看更多原創內容：godbmw.com，進行“姿勢”交流 ♪(∇*) 1. 什麼時候需要並查集？在一些有 N 個元素的集合應用問題中

並查集：按秩合併 $n$ 個點所得樹高不超過 $\lfloor\log n \rfloor$

用 $h_n$ 表示按秩合併 $n$ 個點所得樹的最大高度。有 $h_1 = 0, h_2 = 1, h_3 = 1, h_4 = 2, h_5 = 2, \dots$ 有如下地推： \[ h_n = \max_{1\le i\le n-1} \max(h_i, h_{n-i}) + [h_i = h_{n

並查集求集合個數和每個集合中的元素個數

思路：維護一個數組，代表以某個結點為根的樹的結點數目，初始化為全1。在合併兩個集合時，將秩較小的集合的元素數目加到秩較大的集合上。這裡需要注意一下，就是Union過程處理兩個祖先相同的結點，此時實際上沒有真正的合併這兩個結點，所以不需要更新集合的元素數目。至於統計集合個數就

並查集：POJ 1182 食物鏈復習

iostream unit color clu string using pan n) else #include <iostream> #include <algorithm> #include <cstring> #incl

並查集：擒賊先擒王

name 節點單元 spa pan 人的 find 子集還要定義並查集，在一些有$N$個元素的集合應用問題中，我們通常是在開始時讓每個元素構成一個單元素的集合，然後按一定順序將屬於同一組的元素所在的集合合並，其間要反復查找一個元素在哪個集合中。這一類問題近幾年來

HDU 3635 Dragon Balls（並查集：路徑壓縮）

Problem Description Five hundred years later, the number of dragon balls will increase unexpectedly, so it's too difficult for Monkey King(WuKong) t

bzoj3237 [Ahoi2013]連通圖線段樹分治+並查集按秩合併

Description 給定n個點m條邊的無向圖，k次詢問，每次刪除s條邊並詢問此時圖的連通性，詢問互相獨立。 n<=1e5,m<=2e5,k<=1e5,s<=4 Solution 傳說中的線段樹分治刪除和插入同時存在的話非常麻煩，因此考

【bzoj4530】[Bjoi2014]大融合並查集+線段樹合併

線段樹合併好神啊，表示我這種傻逼只能想到樹剖O(nlog^2n)做法先把原樹建出來，每次查詢就等價於計運算元節點的size*(父親節點所在聯通塊的大小-子節點的size) 用並查集找到節點的祖先，維護子樹size 這個東西可以用線段樹合併來做，查詢就是查詢dfs序上的一段

並查集：按秩歸併&路徑壓縮

集合可以怎麼表示？可以用一棵樹來表示，結點表示集合的元素，而樹根則用來代表這個集合。所以用樹來做集合的並查集的話，對於查詢某個元素屬於哪個集合，我們就從這個結點開始往上找，找到它所在的這棵樹的根結點。對於並集操作，只要把兩棵樹的根結點並在一起就可以了。所以為了滿足這樣的操作，

Restructuring Company （並查集的區間合併）

題目大意：一共有n個單點集，三種操作： type1 x y代表：合併x和y所在集合 type2 x y代表：合併x,x+1,…,y-1,y（x到y的區間）所在集合 type3 x y代表：查詢x和y是否在同一集合是輸出YES, 否輸出NO 思

Bond（並查集-按秩合併）

題意：給出一張n個點m條邊的無向圖，每條邊有一個危險度，有q個詢問，每次給出兩個點s、t，找一條路，使得路徑上的最大危險度最小。思路：首先，我們可以發現，如果求一個最小生成樹，那麼任意兩點，在生成樹上有唯一路徑，而且這條路徑上的最大危險值一定最小。但是n和

並查集：HDU4496-D-City（倒用並查集）

D-City Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65535/65535 K (Java/Others) Total Submission(s): 2448 Accepted

親屬關係--並查集訓練T1（並查集之老大合併問題）

T1.親屬關係(relation.pas) 【問題描述】若某個家族人員過於龐大，要判斷兩個是否是親戚，確實還很不容易，現在給出某個親戚關係圖，求任意給出的兩個人是否具有親戚關係。規定：x和y是親戚，y和z是親戚，那麼x和z也是親戚。如果x,y是親戚，那麼x的親戚都是y的親戚，y的親戚也都是x的親戚。【

關於並查集的區間合併的思考

在下午的訓練中，一道區間合併的題目卡了兩個多小時，想想就可怕，回想就是思路有了，應該如何實現，卻沒有了具體執行的程式碼，在自己的一次次嘗試中，也沒有過去，自己之後搜尋題解，發現主要就是右邊界和跨域，但是自己在場上的時候卻寫不出來，可怕可怕。 Knight Tournamen

並查集演算法的簡介與演算法實現

並查集（Union-find Sets）是一種非常精巧而實用的資料結構，它主要用於處理一些不相交集合的合併問題。一些常見的用途有求連通子圖、求最小生成樹的 Kruskal 演算法和求最近公共祖先（Least Common Ancestors, LCA）等。使用並查集時，首先會存在一組不相交的動態集合 S=

並查集：學習總結

剔除最小值 cst 之間 int 勿噴決戰建立食物 $ ??????????????? ? $學習總結：並查集蒟蒻的第一篇博客，如有bug，請大佬提出，勿噴。並查集：並查集雖說是集合，不過個人覺得類似樹形結構，像森林，剛開始每一個節點是一個森林，不斷把森林合並

【並查集】一種與時間賽跑的巧妙演算法

**【並查集】一種與時間賽跑的巧妙演算法** # 引入：（NOIP模擬題）極端寒冬 **（不要求剛剛接觸並查集的讀者完全明白本題）** 先了解一下並查集是個什麼東西： **合併兩點所在集合** 和 **查詢兩點是否在同一集合** 的演算法那有什麼用處呢？我們先來看一道NOIP模擬題![在這裡插入圖片

POJ 1703 Find them, Catch them（確定元素歸屬集合的並查集）

eas scanf sea must ret them 不能 4.0 police Find them, Catch them Time Limit: 1000MS Memory Limit: 10000K Total Submissio

HDU - 1856 並查集，尋找最大集合元素個數

#include<stdio.h> #include<iostream> #include<algorithm> using namespace std; int fa[10000000]; int mark[10000000]; int findroot(int

並查集的優化---路徑壓縮與啟發式合併

並查集的優化分為兩類：一種是優化查詢的路徑壓縮，一種是啟發式合併（按集合大小合併與按秩（高）合併）路徑壓縮 a.描述：如果查詢的總路徑過長，尤其是一條鏈的情況下，那麼樸素的查詢可能會超時。於

並查集：集合合併與元素查詢

1. 什麼時候需要並查集？

2. 如何實現並查集？

2.1 實現查詢操作

2.2 實現合併操作

3. 演算法分析和優化

3.1 合併優化

3.2 “路徑壓縮”

4. 程式碼實現

5. 程式碼測試

相關推薦