並查集詳解
這個文章是幾年前水acm的時候轉的, 當時也不知道作者是誰, 要是有人知道的話說一下吧
並查集是我暑假從高手那裡學到的一招,覺得真是太精妙的設計了。以前我無法解決的一類問題竟然可以用如此簡單高效的方法搞定。不分享出來真是對不起party了。(party:我靠,關我嘛事啊?我跟你很熟麼?)
首先在地圖上給你若干個城鎮,這些城鎮都可以看作點,然後告訴你哪些對城鎮之間是有道路直接相連的。最後要解決的是整幅圖的連通性問題。比如隨意給你兩個點,讓你判斷它們是否連通,或者問你整幅圖一共有幾個連通分支,也就是被分成了幾個互相獨立的塊。像暢通工程這題,問還需要修幾條路,實質就是求有幾個連通分支。如果是1個連通分支,說明整幅圖上的點都連起來了,不用再修路了;如果是2個連通分支,則只要再修1條路,從兩個分支中各選一個點,把它們連起來,那麼所有的點都是連起來的了;如果是3個連通分支,則只要再修兩條路……
以下面這組資料輸入資料來說明
4 2 1 3 4 3
第一行告訴你,一共有4個點,2條路。下面兩行告訴你,1、3之間有條路,4、3之間有條路。那麼整幅圖就被分成了1-3-4和2兩部分。只要再加一條路,把2和其他任意一個點連起來,暢通工程就實現了,那麼這個這組資料的輸出結果就是1。好了,現在程式設計實現這個功能吧,城鎮有幾百個,路有不知道多少條,而且可能有迴路。 這可如何是好?
我以前也不會呀,自從用了並查集之後,嗨,效果還真好!我們全家都用它!
並查集由一個整數型的陣列和兩個函式構成。陣列pre[]記錄了每個點的前導點是什麼,函式find是查詢,join是合併。
int pre[1000 ];
int find(int x)
//查詢根節點
{
int r=x;
while ( pre[r ] != r ) //返回根節點 r
r=pre[r ];
int i=x , j ;
while( i != r )
//路徑壓縮
{
j = pre[ i ]; // 在改變上級之前用臨時變數 j 記錄下他的值
pre[ i ]= r ; //把上級改為根節點
i=j;
}
return r ;
}
void join(int x,int y) //判斷x y是否連通,
//如果已經連通,就不用管了 //如果不連通,就把它們所在的連通分支合併起,
{
int fx=find(x),fy=find(y);
if(fx!=fy)
pre[fx ]=fy;
}
為了解釋並查集的原理,我將舉一個更有愛的例子。 話說江湖上散落著各式各樣的大俠,有上千個之多。他們沒有什麼正當職業,整天揹著劍在外面走來走去,碰到和自己不是一路人的,就免不了要打一架。但大俠們有一個優點就是講義氣,絕對不打自己的朋友。而且他們信奉“朋友的朋友就是我的朋友”,只要是能通過朋友關係串聯起來的,不管拐了多少個彎,都認為是自己人。這樣一來,江湖上就形成了一個一個的群落,通過兩兩之間的朋友關係串聯起來。而不在同一個群落的人,無論如何都無法通過朋友關係連起來,於是就可以放心往死了打。但是兩個原本互不相識的人,如何判斷是否屬於一個朋友圈呢?
我們可以在每個朋友圈內推舉出一個比較有名望的人,作為該圈子的代表人物,這樣,每個圈子就可以這樣命名“齊達內朋友之隊”“羅納爾多朋友之隊”……兩人只要互相對一下自己的隊長是不是同一個人,就可以確定敵友關係了。
但是還有問題啊,大俠們只知道自己直接的朋友是誰,很多人壓根就不認識隊長,要判斷自己的隊長是誰,只能漫無目的的通過朋友的朋友關係問下去:“你是不是隊長?你是不是隊長?”這樣一來,隊長面子上掛不住了,而且效率太低,還有可能陷入無限迴圈中。於是隊長下令,重新組隊。隊內所有人實行分等級制度,形成樹狀結構,我隊長就是根節點,下面分別是二級隊員、三級隊員。每個人只要記住自己的上級是誰就行了。遇到判斷敵友的時候,只要一層層向上問,直到最高層,就可以在短時間內確定隊長是誰了。由於我們關心的只是兩個人之間是否連通,至於他們是如何連通的,以及每個圈子內部的結構是怎樣的,甚至隊長是誰,並不重要。所以我們可以放任隊長隨意重新組隊,只要不搞錯敵友關係就好了。於是,門派產生了。
http://i3.6.cn/cvbnm/6f/ec/f4/1e9cfcd3def64d26ed1a49d72c1f6db9.jpg
下面我們來看並查集的實現。 int pre[1000]; 這個陣列,記錄了每個大俠的上級是誰。大俠們從1或者0開始編號(依據題意而定),pre[15]=3就表示15號大俠的上級是3號大俠。如果一個人的上級就是他自己,那說明他就是掌門人了,查詢到此為止。也有孤家寡人自成一派的,比如歐陽鋒,那麼他的上級就是他自己。每個人都只認自己的上級。比如胡青牛同學只知道自己的上級是楊左使。張無忌是誰?不認識!要想知道自己的掌門是誰,只能一級級查上去。 find這個函式就是找掌門用的,意義再清楚不過了(路徑壓縮演算法先不論,後面再說)。
int find(int x) //查詢我(x)的掌門
{
int r=x; //委託 r 去找掌門
while (pre[r ]!=r) //如果r的上級不是r自己(也就是說找到的大俠他不是掌門 = =)
r=pre[r ] ; // r 就接著找他的上級,直到找到掌門為止。
return r ; //掌門駕到~~~
}
再來看看join函式,就是在兩個點之間連一條線,這樣一來,原先它們所在的兩個板塊的所有點就都可以互通了。這在圖上很好辦,畫條線就行了。但我們現在是用並查集來描述武林中的狀況的,一共只有一個pre[]陣列,該如何實現呢? 還是舉江湖的例子,假設現在武林中的形勢如圖所示。虛竹小和尚與周芷若MM是我非常喜歡的兩個人物,他們的終極boss分別是玄慈方丈和滅絕師太,那明顯就是兩個陣營了。我不希望他們互相打架,就對他倆說:“你們兩位拉拉勾,做好朋友吧。”他們看在我的面子上,同意了。這一同意可非同小可,整個少林和峨眉派的人就不能打架了。這麼重大的變化,可如何實現呀,要改動多少地方?其實非常簡單,我對玄慈方丈說:“大師,麻煩你把你的上級改為滅絕師太吧。這樣一來,兩派原先的所有人員的終極boss都是師太,那還打個球啊!反正我們關心的只是連通性,門派內部的結構不要緊的。”玄慈一聽肯定火大了:“我靠,憑什麼是我變成她手下呀,怎麼不反過來?我抗議!”抗議無效,上天安排的,最大。反正誰加入誰效果是一樣的,我就隨手指定了一個。這段函式的意思很明白了吧?
void join(int x,int y) //我想讓虛竹和周芷若做朋友
{
int fx=find(x),fy=find(y); //虛竹的老大是玄慈,芷若MM的老大是滅絕
if(fx!=fy) //玄慈和滅絕顯然不是同一個人
pre[fx ]=fy; //方丈只好委委屈屈地當了師太的手下啦
}
再來看看路徑壓縮演算法。建立門派的過程是用join函式兩個人兩個人地連線起來的,誰當誰的手下完全隨機。最後的樹狀結構會變成什麼胎脣樣,我也完全無法預計,一字長蛇陣也有可能。這樣查詢的效率就會比較低下。最理想的情況就是所有人的直接上級都是掌門,一共就兩級結構,只要找一次就找到掌門了。哪怕不能完全做到,也最好儘量接近。這樣就產生了路徑壓縮演算法。 設想這樣一個場景:兩個互不相識的大俠碰面了,想知道能不能揍。 於是趕緊打電話問自己的上級:“你是不是掌門?” 上級說:“我不是呀,我的上級是誰誰誰,你問問他看看。” 一路問下去,原來兩人的最終boss都是東廠曹公公。 “哎呀呀,原來是記己人,西禮西禮,在下三營六組白麵葫蘆娃!” “幸會幸會,在下九營十八組仙子狗尾巴花!” 兩人高高興興地手拉手喝酒去了。 “等等等等,兩位同學請留步,還有事情沒完成呢!”我叫住他倆。 “哦,對了,還要做路徑壓縮。”兩人醒悟。 白麵葫蘆娃打電話給他的上級六組長:“組長啊,我查過了,其習偶們的掌門是曹公公。不如偶們一起及接拜在曹公公手下吧,省得級別太低,以後查詢掌門麻環。” “唔,有道理。” 白麵葫蘆娃接著打電話給剛才拜訪過的三營長……仙子狗尾巴花也做了同樣的事情。 這樣,查詢中所有涉及到的人物都聚集在曹公公的直接領導下。每次查詢都做了優化處理,所以整個門派樹的層數都會維持在比較低的水平上。路徑壓縮的程式碼,看得懂很好,看不懂也沒關係,直接抄上用就行了。總之它所實現的功能就是這麼個意思。
- #include<iostream>
- usingnamespace std;
- int pre[1050];
- bool t[1050]; //t 用於標記獨立塊的根結點
- int Find(int x)
- {
- int r=x;
- while(r!=pre[r])
- r=pre[r];
- int i=x,j;
- while(pre[i]!=r)
- {
- j=pre[i];
- pre[i]=r;
- i=j;
- }
- return r;
- }
- void mix(int x,int y)
- {
- int fx=Find(x),fy=Find(y);
- if(fx!=fy)
- {
- pre[fy]=fx;
- }
- }
- int main()
- {
- int N,M,a,b,i,j,ans;
- while(scanf("%d%d",&N,&M)&&N)
- {
- for(i=1;i<=N;i++) //初始化
- pre[i]=i;
- for(i=1;i<=M;i++) //吸收並整理資料
- {
- scanf("%d%d",&a,&b);
- mix(a,b);
- }
- memset(t,0,sizeof(t));
- for(i=1;i<=N;i++) //標記根結點
- {
- t[Find(i)]=1;
- }
- for(ans=0,i=1;i<=N;i++)
- if(t[i])
- ans++;
- printf("%d\n",ans-1);
- }
- return 0;
- }//dellaserss
#include<iostream>
using namespace std;
int pre[1050];
bool t[1050]; //t 用於標記獨立塊的根結點
int Find(int x)
{
int r=x;
while(r!=pre[r])
r=pre[r];
int i=x,j;
while(pre[i]!=r)
{
j=pre[i];
pre[i]=r;
i=j;
}
return r;
}
void mix(int x,int y)
{
int fx=Find(x),fy=Find(y);
if(fx!=fy)
{
pre[fy]=fx;
}
}
int main()
{
int N,M,a,b,i,j,ans;
while(scanf("%d%d",&N,&M)&&N)
{
for(i=1;i<=N;i++) //初始化
pre[i]=i;
for(i=1;i<=M;i++) //吸收並整理資料
{
scanf("%d%d",&a,&b);
mix(a,b);
}
memset(t,0,sizeof(t));
for(i=1;i<=N;i++) //標記根結點
{
t[Find(i)]=1;
}
for(ans=0,i=1;i<=N;i++)
if(t[i])
ans++;
printf("%d\n",ans-1);
}
return 0;
}//dellaserss
以下為原文附的程式碼:
回到開頭提出的問題,我的程式碼如下:
#include int pre[1000 ];
int find(int x)
{
int r=x;
while (pre[r ]!=r)
r=pre[r ];
int i=x; int j;
while(i!=r)
{
j=pre[i ];
pre[i ]=r;
i=j;
}
return r;
}
int main()
{
int n,m,p1,p2,i,total,f1,f2;
while(scanf("%d",&n) && n) //讀入n,如果n為0,結束
{ //剛開始的時候,有n個城鎮,一條路都沒有 //那麼要修n-1條路才能把它們連起來
total=n-1;
//每個點互相獨立,自成一個集合,從1編號到n //所以每個點的上級都是自己
for(i=1;i<=n;i++) { pre[i ]=i; } //共有m條路
scanf("%d",&m); while(m--)
{ //下面這段程式碼,其實就是join函式,只是稍作改動以適應題目要求
//每讀入一條路,看它的端點p1,p2是否已經在一個連通分支裡了
scanf("%d %d",&p1,&p2);
f1=find(p1);
f2=find(p2);
//如果是不連通的,那麼把這兩個分支連起來
//分支的總數就減少了1,還需建的路也就減了1
if(f1!=f2)
{
pre[f2 ]=f1;
total--;
}
//如果兩點已經連通了,那麼這條路只是在圖上增加了一個環 //對連通性沒有任何影響,無視掉
}
//最後輸出還要修的路條數
printf("%d\n",total);
}
return 0;
}