1. 程式人生 > >數據結構_並查集(轉載)

數據結構_並查集(轉載)

target blog 隨機 輸出 無法 增加 輸出結果 還需 class

一、問題引入

原題:杭電hdu1232暢通工程

題意:首先在地圖上給你若幹個城鎮,這些城鎮都可以看作點,然後告訴你哪些對城鎮之間是有道路直接相連的。最後要解決的是整幅圖的連通性問題。比如隨意給你兩個點,讓你判斷它們是否連通,或者問你整幅圖一共有幾個連通分支,也就是被分成了幾個互相獨立的塊。像暢通工程這題,問還需要修幾條路,實質就是求有幾個連通分支。如果是1個連通分支,說明整幅圖上的點都連起來了,不用再修路了;如果是2個連通分支,則只要再修1條路,從兩個分支中各選一個點,把它們連起來,那麽所有的點都是連起來的了;如果是3個連通分支,則只要再修兩條路……

說明:輸入4 2 1 3 4 3。即一共有4個點,2條路。下面兩行告訴你,1、3之間有條路,4、3之間有條路。那麽整幅圖就被分成了1-3-4和2兩部分。只要再加一條路,把2和其他任意一個點連起來,暢通工程就實現了,那麽這個這組數據的輸出結果就是1。好了,現在編程實現這個功能吧,城鎮有幾百個,路有不知道多少條,而且可能有回路。 這可如何是好? 我以前也不會呀,自從用了並查集之後,嗨,效果還真好!

二、故事描述

並查集由一個整數型的數組和兩個函數構成。數組pre[]記錄了每個點的前導點是什麽,函數find是查找,函數join是合並。

話說江湖上散落著各式各樣的大俠,有上千個之多。他們沒有什麽正當職業,整天背著劍在外面走來走去,碰到和自己不是一路人的,就免不了要打一架。但大俠們有一個優點就是講義氣,絕對不打自己的朋友。而且他們信奉“朋友的朋友就是我的朋友”,只要是能通過朋友關系串聯起來的,不管拐了多少個彎,都認為是自己人。這樣一來,江湖上就形成了一個一個的群落,通過兩兩之間的朋友關系串聯起來。而不在同一個群落的人,無論如何都無法通過朋友關系連起來,於是就可以放心往死了打。但是兩個原本互不相識的人,如何判斷是否屬於一個朋友圈呢? 我們可以在每個朋友圈內推舉出一個比較有名望的人,作為該圈子的代表人物,這樣,每個圈子就可以這樣命名“齊達內朋友之隊”“羅納爾多朋友之隊”……兩人只要互相對一下自己的隊長是不是同一個人,就可以確定敵友關系了。 但是還有問題啊,大俠們只知道自己直接的朋友是誰,很多人壓根就不認識隊長,要判斷自己的隊長是誰,只能漫無目的的通過朋友的朋友關系問下去:“你是不是隊長?你是不是隊長?” 這樣一來,隊長面子上掛不住了,而且效率太低,還有可能陷入無限循環中。於是隊長下令,重新組隊。隊內所有人實行分等級制度,形成樹狀結構,我隊長就是根節點,下面分別是二級隊員、三級隊員。每個人只要記住自己的上級是誰就行了。遇到判斷敵友的時候,只要一層層向上問,直到最高層,就可以在短時間內確定隊長是誰了。由於我們關心的只是兩個人之間是否連通,至於他們是如何連通的,以及每個圈子內部的結構是怎樣的,甚至隊長是誰,並不重要。所以我們可以放任隊長隨意重新組隊,只要不搞錯敵友關系就好了。於是,門派產生了。  技術分享圖片

下面我們來看並查集的實現。 int pre[1000]; 這個數組,記錄了每個大俠的上級是誰。大俠們從1或者0開始編號(依據題意而定),pre[15]=3就表示15號大俠的上級是3號大俠。如果一個人的上級就是他自己,那說明他就是掌門人了,查找到此為止。也有孤家寡人自成一派的,比如歐陽鋒,那麽他的上級就是他自己。每個人都只認自己的上級。比如胡青牛同學只知道自己的上級是楊左使。張無忌是誰?不認識!要想知道自己的掌門是誰,只能一級級查上去。 find這個函數就是找掌門用的,意義再清楚不過了(路徑壓縮算法先不論,後面再說)。

1 int find(int x)                        //
查找x的掌門 2 { 3 int r=x; //委托 r 去找掌門 4 while(pre[r] != r) //如果r的上級不是r自己(也就是說找到的大俠他不是掌門 = =) 5 r = pre[r] ; // r 接著找他的上級,直到找到掌門為止。 6 return r ; //掌門駕到~~~ 7 }

再來看看join函數,就是在兩個點之間連一條線,這樣一來,原先它們所在的兩個板塊的所有點就都可以互通了。這在圖上很好辦,畫條線就行了。但我們現在是用並查集來描述武林中的狀況的,一共只有一個pre[]數組,該如何實現呢? 還是舉江湖的例子,假設現在武林中的形勢如圖所示。虛竹小和尚與周芷若MM是我非常喜歡的兩個人物,他們的終極boss分別是玄慈方丈和滅絕師太,那明顯就是兩個陣營了。我不希望他們互相打架,就對他倆說:“你們兩位拉拉勾,做好朋友吧。”他們看在我的面子上,同意了。這一同意可非同小可,整個少林和峨眉派的人就不能打架了。這麽重大的變化,可如何實現呀,要改動多少地方?其實非常簡單,我對玄慈方丈說:“大師,麻煩你把你的上級改為滅絕師太吧。這樣一來,兩派原先的所有人員的終極boss都是師太,那還打個球啊!反正我們關心的只是連通性,門派內部的結構不要緊的。”玄慈一聽肯定火大了:“我靠,憑什麽是我變成她手下呀,怎麽不反過來?我抗議!”抗議無效,上天安排的,最大。反正誰加入誰效果是一樣的,我就隨手指定了一個。這段函數的意思很明白了吧?

1 void join(int x,int y)                     //我想讓虛竹和周芷若做朋友
2 {
3     int fx=find(x), fy=find(y);             //虛竹的老大是玄慈,芷若MM的老大是滅絕
4     if(fx != fy)                             //玄慈和滅絕顯然不是同一個人
5         pre[fx]=fy;                       //方丈只好委委屈屈地當了師太的手下啦
6 }

再來看看路徑壓縮算法。建立門派的過程是用join函數兩個人兩個人地連接起來的,誰當誰的手下完全隨機。最後的樹狀結構會變成什麽樣,我也完全無法預計,一字長蛇陣也有可能。這樣查找的效率就會比較低下。最理想的情況就是所有人的直接上級都是掌門,一共就兩級結構,只要找一次就找到掌門了。哪怕不能完全做到,也最好盡量接近。這樣就產生了路徑壓縮算法。 設想這樣一個場景:兩個互不相識的大俠碰面了,想知道能不能揍。 於是趕緊打電話問自己的上級:“你是不是掌門?” 上級說:“我不是呀,我的上級是誰誰誰,你問問他看看。” 一路問下去,原來兩人的最終boss都是東廠曹公公。 “哎呀呀,原來是記己人,西禮西禮,在下三營六組白面葫蘆娃!” “幸會幸會,在下九營十八組仙子狗尾巴花!” 兩人高高興興地手拉手喝酒去了。 “等等等等,兩位同學請留步,還有事情沒完成呢!”我叫住他倆。 “哦,對了,還要做路徑壓縮。”兩人醒悟。 白面葫蘆娃打電話給他的上級六組長:“組長啊,我查過了,其習偶們的掌門是曹公公。不如偶們一起直接拜在曹公公手下吧,省得級別太低,以後查找掌門麻環。” “唔,有道理。” 白面葫蘆娃接著打電話給剛才拜訪過的三營長……仙子狗尾巴花也做了同樣的事情。 這樣,查詢中所有涉及到的人物都聚集在曹公公的直接領導下。每次查詢都做了優化處理,所以整個門派樹的層數都會維持在比較低的水平上。路徑壓縮的代碼,看得懂很好,看不懂也沒關系,直接抄上用就行了。總之它所實現的功能就是這麽個意思。

技術分享圖片

三、算法描述

關鍵特征:

①用集合中的某個元素來代表這個集合,該元素稱為集合的代表元

②一個集合內的所有元素組織成以代表元為根的樹形結構;

③對於每一個元素 pre[x]指向x在樹形結構上的父親節點。如果x是根節點,則令pre[x] = x;

④對於查找操作,假設需要確定x所在的的集合,也就是確定集合的代表元。可以沿著pre[x]不斷在樹形結構中向上移動,直到到達根節點。

判斷兩個元素是否屬於同一集合,只需要看他們的代表元是否相同即可。

路徑壓縮:

為了加快查找速度,查找時將x到根節點路徑上的所有點的pre(上級)設為根節點,該優化方法稱為壓縮路徑。使用該優化後,平均復雜度可視為Ackerman函數的反函數,實際應用中可粗略認為其是一個常數。

用途:

1、維護無向圖的連通性。支持判斷兩個點是否在同一連通塊內,和判斷增加一條邊是否會產生環。

2、用在求解最小生成樹的Kruskal算法裏。

一般來說,一個並查集對應三個操作:初始化+查找根結點函數+合並集合函數

【初始化】

包括對所有單個的數據建立一個單獨的集合(即根據題目的意思自己建立的最多可能有的集合,為下面的合並查找操作提供操作對象)。

在每一個單個的集合裏面,有三個東西。

①集合所代表的數據(這個初始值根據需要自己定義,不固定) ;

②這個集合的層次通常用rank表示(一般來說,初始化的工作之一就是將每一個集合裏的rank置為1);

③這個集合的類別pre(其實就是一個指針,用來指示這個集合屬於那一類,合並過後的集合,他們的pre指向的最終值一定是相同的) (有的簡單題裏面集合的數據就是這個集合的標號,也就是說只包含2和3,1省略了)。

初始化的時候,每一個集合的pre都是這個集合自己的標號。沒有跟它同類的集合,那麽這個集合的源頭只能是自己了。

最簡單的集合就只含有這三個東西了,當然,復雜的集合就是把3指針這一項添加內容,如PKU食物鏈那題,我們還可以添加enemy指針,表示這個物種集合的天敵集合;food指針,表示這個物種集合的食物集合。隨著指針的增加,並查集操作起來也變得復雜,題目也就顯得更難了。

數組表示法

設置很多相同大小的數組,如:

1 int pre[max];   //集合index的類別,或者用parent表示 
2 int rank[max];  //集合index的層次,通常初始化為0 
3 int data[max];  //集合index的數據類型  
4 //初始化集合 
5 void Make_pre(int i) 
6 {     
7     pre[i]=i;   //一個集合的pre都是這個集合自己的標號。沒有跟它同類的集合,那麽這個集合的源頭只能是自己了。  
8     rank[i]=0; 
9 }

【查找函數】

就是找到pre指針的源頭,可以把函數命名為find_pre,如果集合的pre等於集合的編號(即還沒有被合並或者沒有同類),那麽自然返回自身編號。 如果不同(即經過合並操作後指針指向了源頭(合並後選出的rank高的集合))那麽就可以調用遞歸函數,如下面的代碼:

1 //查找集合i(一個元素是一個集合)的源頭(遞歸實現)
2 int Find_pre(int i)
3 { 
4     //如果集合i的父親是自己,說明自己就是源頭,返回自己的標號
5    if(pre[i]==i)
6        return pre[i];
7     //否則查找集合i的父親的源頭
8     return  Find_pre(pre[i]);        
9 }

【合並集合函數】

技術分享圖片

這就是所謂並查集的並了。至於怎麽知道兩個集合是可以合並的,那就是題目的條件了。先看代碼:

 1 void Union(int i,int j)
 2 {
 3     i=Find_pre(i);
 4     j=Find_pre(j);
 5     if(i==j) return ;
 6     if(rank[i]>rank[j]) pre[j]=i;
 7     else
 8     {
 9         if(rank[i]==rank[j]) rank[j]++;   
10         pre[i]=j;
11     }
12 }

四、代碼實現

 1 #define N 105
 2 int pre[N];     //每個結點 
 3 int rank[N];    //樹的高度 
 4 //初始化
 5 int init(int n)     //對n個結點初始化 
 6 {
 7     for(int i = 0; i < n; i++){
 8         pre[i] = i;     //每個結點的上級都是自己 
 9         rank[i] = 1;    //每個結點構成的樹的高度為1 
10     } 
11 }
12  
13 int find_pre(int x)     //查找結點x的根結點 
14 {
15     if(pre[x] == x){        //遞歸出口:x的上級為x本身,即x為根結點 
16         return x;       
17     }
18     return find_pre(pre[x]);    //遞歸查找 
19 } 
20  
21 //改進查找算法:完成路徑壓縮,將x的上級直接變為根結點,那麽樹的高度就會大大降低 
22 int find_pre(int x)     //查找結點x的根結點 
23 {
24     if(pre[x] == x){        //遞歸出口:x的上級為x本身,即x為根結點 
25         return x;       
26     }
27     return pre[x] = find_pre(pre[x]);   //遞歸查找  此代碼相當於 先找到根結點rootx,然後pre[x]=rootx 
28 } 
29  
30  
31 bool is_same(int x, int y)      //判斷兩個結點是否連通 
32 {
33     return find_pre(x) == find_pre(y);  //判斷兩個結點的根結點(亦稱代表元)是否相同 
34 }
35  
36 void unite(int x,int y)
37 {
38     int rootx, rooty;
39     rootx = find_pre(x);
40     rooty = find_pre(y);
41     if(rootx == rooty){
42         return ;
43     }
44     if(rank(rootx) > rank(rooty)){
45         pre[rooty] = rootx;         //令y的根結點的上級為rootx 
46     }
47     else{
48         if(rank(rootx) == rank(rooty)){
49             rank(rooty)++;
50         }
51         pre[rootx] = rooty;
52     }
53 } 

轉載:https://www.cnblogs.com/xzxl/p/7226557.html

關於並查集進一步學習可以看一下這個博客:http://www.cnblogs.com/xzxl/p/7341536.html

數據結構_並查集(轉載)