【並查集】一種與時間賽跑的巧妙演算法
阿新 • • 發佈:2020-09-20
**【並查集】一種與時間賽跑的巧妙演算法**
# 引入:(NOIP模擬題)極端寒冬
**(不要求剛剛接觸並查集的讀者完全明白本題)**
先了解一下並查集是個什麼東西:
**合併兩點所在集合** 和 **查詢兩點是否在同一集合** 的演算法
那有什麼用處呢?
我們先來看一道NOIP模擬題![在這裡插入圖片描述](https://img-blog.csdnimg.cn/20200920085358214.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxMjcxODc1Njk0MQ==,size_16,color_FFFFFF,t_70#pic_center)
**我們先來看一下題意是什麼:**
首先,有一個n*m的地圖,k個障礙,每個障礙會按順序在不同的時間冒出
問地圖上最多能容納多少個障礙,使得從(1,1)到(n,m)仍保持聯通
**那我們可以怎麼做呢?**
最先也是最容易想到的就是**搜尋**
每次新增一個障礙,就搜尋判斷地圖的連通性
但是,時間複雜度約為O(k(n*m)) ~~[口胡]~~
3 * 10^4^ * 3 * 10^4^ * 10^5^ = 9 * 10^13^
超時,但小資料應該勉強能拿2、30分
然後我們會想到做**分塊**(分塊思想:[從疫情中的體溫測量到分塊思想的運用 ](https://www.cnblogs.com/pqh-/p/13167792.html))
如果給k個障礙,那麼我們把他分成√k堆,每堆√k個障礙
每次新增√k個障礙,然後搜尋判斷連通性
如果不連通,再對√k個障礙,挨個搜尋判斷連通性
那麼,時間複雜度約為O(√k(n*m)*2) ~~[口胡]~~
時間還是不夠,必定會超時,勉強拿40分
之後我們會想到更快的暴力:**二分答案**
如果給k個障礙,那麼我們把他分成2堆,每堆k/2個障礙
新增k/2個障礙,之後搜尋判斷連通性
左側不連通就二分再次左側,右側不連通就二分再次右側
最後就能找到最多能容納的障礙
所以時間複雜度約為O(㏒(k)*(n *m)) ~~[口胡]~~
所用時間也還是較大,估計拿50分左右
**那麼正解是什麼呢?**
我們會發現所用時間較大與去搜索連通性有密切關係
地圖越大,就算優化列舉障礙放置,搜尋連通性也耗時過多
那麼,我們可以**不去搜索地圖的連通性**嗎?
答案是可以的
我們可以知道,地圖如果不連通
那麼障礙一定是從地圖左/下邊界一直連通到右、上側邊界的
![在這裡插入圖片描述](https://img-blog.csdnimg.cn/20200920093228991.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxMjcxODc1Njk0MQ==,size_16,color_FFFFFF,t_70#pic_center)這很容易證明,過程略
所以題目就轉化為了**障礙是否具有連通性**
(從地圖左/下邊界一直連通到右/上側邊界是否具有連通性)
可以列舉+染色,也不復雜的暴力
但時間還沒有最優
所以我們想到**並查集**
去合併障礙,看障礙的連通性
賣個關子,我們先講一下並查集的主要內容
# 並查集
剛剛說過,並查集是**合併兩點所在集合** 和 **查詢兩點是否在同一集合** 的演算法
## 瞭解
**並查集本質是樹狀結構**
把每個集合看成一棵樹
初始時,每個點就是一棵樹
每次合併是將兩棵樹的根節點連線
**合併集合**像歸順之類的一樣:**樹A和樹B,A和B有關係,A就加入B,A的根節點就是B的根節點**
**查詢節點是否在同一集合**就去查詢:**節點X和Y,X所在樹的根節點 是否等於 Y的所在樹根節點**
網上已經說得很詳細了,就不贅述了
> 江湖上散落著各式各樣的大俠,有上千個之多。他們沒有什麼正當職業,整天揹著劍在外面走來走去,碰到和自己不是一路人的,就免不了要打一架。但大俠們有一個優點就是講義氣,絕對不打自己的朋友。而且他們信奉“朋友的朋友就是我的朋友”,只要是能通過朋友關係串聯起來的,不管拐了多少個彎,都認為是自己人。這樣一來,江湖上就形成了一個一個的幫派,通過兩兩之間的朋友關係串聯起來。而不在同一個幫派的人,無論如何都無法通過朋友關係連起來,於是就可以放心往死了打。但是兩個原本互不相識的人,如何判斷是否屬於一個朋友圈呢?
我們可以在每個朋友圈內推舉出一個比較有名望的人,作為該圈子的代表人物。這樣,每個圈子就可以這樣命名“中國同胞隊”美國同胞隊”……兩人只要互相對一下自己的隊長是不是同一個人,就可以確定敵友關係了。
但是還有問題啊,大俠們只知道自己直接的朋友是誰,很多人壓根就不認識隊長抓狂要判斷自己的隊長是誰,只能漫無目的的通過朋友的朋友關係問下去:“你是不是隊長?你是不是隊長?”這樣,想打一架得先問個幾十年,餓都餓死了,受不了。這樣一來,隊長面子上也掛不住了,不僅效率太低,還有可能陷入無限迴圈中。於是隊長下令,重新組隊。隊內所有人實行分等級制度,形成樹狀結構,我隊長就是根節點,下面分別是二級隊員、三級隊員。每個人只要記住自己的上級是誰就行了。遇到判斷敵友的時候,只要一層層向上問,直到最高層,就可以在短時間內確定隊長是誰了。由於我們關心的只是兩個人之間是否是一個幫派的,至於他們是如何通過朋友關係相關聯的,以及每個圈子內部的結構是怎樣的,甚至隊長是誰,都不重要了。所以我們可以放任隊長隨意重新組隊,只要不搞錯敵友關係就好了。於是,門派產生了。
下面我們來看並查集的實現。 int fa[1000]; 這個陣列,記錄了每個大俠的上級是誰。大俠們從1或者0開始編號(依據題意而定),fa[15]=3就表示15號大俠的上級是3號大俠。如果一個人的上級就是他自己,那說明他就是掌門人了,查詢到此為止。也有孤家寡人自成一派的,比如歐陽鋒,那麼他的上級就是他自己。每個人都只認自己的上級。比如胡青牛同學只知道自己的上級是楊左使。張無忌是誰?不認識!要想知道自己的掌門是誰,只能一級級查上去。
再來看看加入門派,就是在兩個點之間連一條線,這樣一來,原先它們所在的兩個板塊的所有點就都可以互通了。這在圖上很好辦,畫條線就行了。但我們現在是用並查集來描述武林中的狀況的,一共只有一個fa[]陣列,該如何實現呢? 還是舉江湖的例子,假設現在武林中的形勢如圖所示。虛竹帥鍋與周芷若MM是我非常喜歡的兩個人物,他們的終極boss分別是玄慈方丈和滅絕師太,那明顯就是兩個陣營了。我不希望他們互相打架,就對他倆說:“你們兩位拉拉勾,做好朋友吧。”他們看在我的面子上,同意了。這一同意可非同小可,整個少林和峨眉派的人就不能打架了。這麼重大的變化,可如何實現呀,要改動多少地方?其實非常簡單,我對玄慈方丈說:“大師,麻煩你把你的上級改為滅絕師太吧。這樣一來,兩派原先的所有人員的終極boss都是師太,那還打個球啊!大笑反正我們關心的只是連通性,門派內部的結構不要緊的。”玄慈一聽肯定火大了:“我靠,憑什麼是我變成她手下呀,怎麼不反過來?我抗議!”於是,兩人相約一戰,殺的是天昏地暗,風雲為之變色啊,但是啊,這場戰爭終究會有勝負,勝者為王。弱者就被吞併了。反正誰加入誰效果是一樣的,門派就由兩個變成一個了。這段函式的意思明白了吧?
再來看看路徑壓縮演算法。建立門派的過程是用加入函式兩個人兩個人地連線起來的,誰當誰的手下完全隨機。最後的樹狀結構會變成什麼樣,我也無法預知,一字長蛇陣也有可能。這樣查詢的效率就會比較低下。最理想的情況就是所有人的直接上級都是掌門,一共就兩級結構,只要找一次就找到掌門了。哪怕不能完全做到,也最好儘量接近。這樣就產生了路徑壓縮演算法。
設想這樣一個場景:兩個互不相識的大俠碰面了,想知道能不能幹一場。 於是趕緊打電話問自己的上級:“你是不是掌門?” 上級說:“我不是呀,我的上級是誰誰誰,你問問他看看。” 一路問下去,原來兩人的最終boss都是東廠曹公公。 “哎呀呀,原來是自己人,有禮有禮,在下三營六組白麵葫蘆娃!” “幸會幸會,在下九營十八組仙子狗尾巴花!” 兩人高高興興地手拉手喝酒去了。 “等等等等,兩位大俠請留步,還有事情沒完成呢!”我叫住他倆。 “哦,對了,還要做路徑壓縮。”兩人醒悟。 白麵葫蘆娃打電話給他的上級六組長:“組長啊,我查過了,其實偶們的掌門是曹公公。不如偶們一起結拜在曹公公手下吧,省得級別太低,以後查詢掌門麻煩。” “唔,有道理。” 白麵葫蘆娃接著打電話給剛才拜訪過的三營長……仙子狗尾巴花也做了同樣的事情。 這樣,查詢中所有涉及到的人物都聚集在曹公公的直接領導下。每次查詢都做了優化處理,所以整個門派樹的層數都會維持在比較低的水平上。路徑壓縮的程式碼,看得懂很好,看不懂可以自己模擬一下,很簡單的一個遞迴而已。總之它所實現的功能就是這麼個意思。
寫的還挺好,我們再詳細說說
# 實現
## 初始化
首先初始化每個節點,使得他們自成一樹
```cpp
void in(){
for(int i=1;i<=n;i++){
fa[i]=i;//樹的根節點
h[i]=1;//樹的深度
}
}
```
所以得到:
![在這裡插入圖片描述](https://img-blog.csdnimg.cn/20200920101758584.jpg?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxMjcxODc1Njk0MQ==,size_16,color_FFFFFF,t_70#pic_center)
## 合併
然後我們對他們進行合併操作:![在這裡插入圖片描述](https://img-blog.csdnimg.cn/20200920102405240.jpg?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxMjcxODc1Njk0MQ==,size_16,color_FFFFFF,t_70#pic_center)
**直接將有關係的點進行連線**
```cpp
int get(int x,int y){
f[f[x]]=y;//將X點的根節點掛到Y上
}
```
但我們會發現,最壞的情況是出現了一條鏈,fa指向自己上一個節點
查詢根節點就會很慢,時間複雜度為O(h)
(下圖注:例圖,與剛剛資料無關)
![在這裡插入圖片描述](https://img-blog.csdnimg.cn/20200920103035470.jpg?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxMjcxODc1Njk0MQ==,size_16,color_FFFFFF,t_70#pic_center)
那麼,我們可以每次合併兩棵樹時,樹A掛在樹B的根節點上
![在這裡插入圖片描述](https://img-blog.csdnimg.cn/20200920103709378.jpg?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxMjcxODc1Njk0MQ==,size_16,color_FFFFFF,t_70#pic_center)
以剛剛的資料為例![在這裡插入圖片描述](https://img-blog.csdnimg.cn/20200920103734283.jpg?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxMjcxODc1Njk0MQ==,size_16,color_FFFFFF,t_70#pic_center)**4和2的關係:**
理論上應該連線2和4
但為了防止鏈,導致find的查詢根節點變慢
就**樹A根節點連線到樹B根節點**
我們再來說一下**樹A根節點連B根節點的方法**
![在這裡插入圖片描述](https://img-blog.csdnimg.cn/20200920105604813.jpg?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxMjcxODc1Njk0MQ==,size_16,color_FFFFFF,t_70#pic_center)**如圖,是A掛B好還是B掛A好?**
(h大為深,h小為淺)
當然是**淺的樹掛在深的樹**上好唄
**淺的樹掛在深的樹的根節點**上,淺的樹一側深度+1(因為頂上多了個深的樹的根節點)
h[淺的樹]+1<=h[深的樹]
而**深的樹掛在淺的樹的根節點**上,深的樹一側深度+1(因為頂上多了個淺的樹的根節點)
h[深的樹]+1>=h[深的樹]
∴h[淺的樹]+1 h[y]){
fa[y]=x;
}else if(h[x]
using namespace std;
int fa[1010];
int h[1010];
void in(){//初始化
for(int i=1;i<=n;i++){
fa[i]=i;
h[i]=1;
}
}
int find(int i){//查(查詢根節點
if(i==fa[i]){
return i;
}
else{
int x=find(fa[i]);
fa[i]=x;
return x;
}
}
void get(int x,int y){//並(合併
x=find(x);
y=find(y);
if(x==y)return ;
else{
if(h[x]>h[y]){
fa[y]=x;
}else if(h[x]