並查集(不相交集合)詳解與java實現
目錄
- 認識並查集
- 並查集解析
- 基本思想
- 如何檢視a,b是否在一個集合?
- a,b合併,究竟是a的祖先合併在b的祖先上,還是b的祖先合併在a上?
- 其他路徑壓縮?
- 程式碼實現
- 結語
@(文章目錄)
認識並查集
對於並查集(不相交集合)
,很多人會感到很陌生
,沒聽過或者不是特別瞭解。實際上並查集是一種挺高效的資料結構。實現簡單,只是所有元素統一遵從一個規律
所以讓辦事情的效率高效起來。
對於定意義,百科上這麼定義的:
並查集,在一些有N個元素的集合應用問題中,我們通常是在開始時讓每個元素構成一個單元素的集合,然後按一定順序將屬於同一組的元素所在的集合合併,其間要反覆查詢一個元素在哪個集合中。其特點是看似並不複雜,但資料量極大,若用正常的資料結構來描述的話,往往在空間上過大,計算機無法承受;即使在空間上勉強通過,執行的時間複雜度也極高,根本就不可能在比賽規定的執行時間(1~3秒)內計算出試題需要的結果,只能用並查集來描述。
並查集是一種樹型的資料結構
,用於處理一些不相交集合(Disjoint Sets)的合併及查詢問題。常常在使用中以森林來表示。
並查集解析
基本思想
- 初始化,一個森林每個都為獨立。通常用陣列表示,每個值初始為-1。
各自為根
join(a,b)
操作。a,b兩個集合
合併。注意這裡的a,並不是a,b合併,而是a,b的集合合併。這就派生了一些情況:- a,b如果是獨立的(沒有和其他合併),那麼直接a指向b(或者b指向a),即
data[a]=b
;同時為了表示這個集合有多少個,原本-1
的b再次-1.即data[b]=-2
.表示以b為父親的節點有|-2|個。
- a,b如果有集合(可能有父親,可能自己是根),那麼我們當然
不能直接操作a,b
(因為a,b可能已經指向別人了.)那麼我們只能操作a,b的祖先。因為a,b的祖先是沒有指向的(即資料為負值表示大小)。那麼他們首先一個負值要加到另外一個上面去。另外這個數值要變成指向的那個表示聯絡。
對於上述你可能會有疑問:
如何檢視a,b是否在一個集合?
- 檢視是否在一個集合,只需要檢視
節點根祖先的結果是否相同即可
。因為只有根的數值是負的,而其他都是正數表示指向的元素。所以只需要一直尋找直到不為正數進行比較即可
!
a,b合併,究竟是a的祖先合併在b的祖先上,還是b的祖先合併在a上?
- 這裡會遇到兩種情況,這個選擇也是非常重要的。你要弄明白一點:樹的高度+1的化那麼整個元素查詢的效率都會降低!
所以我們通常是:小數指向大樹(或者低樹指向高樹),這個使得查詢效率能夠增加!
當然,在高度和數量的選擇上,還需要你自己選擇和考慮。
其他路徑壓縮?
每次查詢,自下向上。當我們呼叫遞迴的時候,可以順便壓縮路徑,因為我們查詢一個元素其實只需要直到它的祖先,所以當他距離祖先近那麼下次查詢就很快
。並且壓縮路徑的代價並不大!
程式碼實現
並查集實現起來較為簡單,直接貼程式碼!
package 並查集不想交集合;
import java.util.Scanner;
public class DisjointSet {
static int tree[]=new int[100000];//假設有500個值
public DisjointSet() {set(this.tree);}
public DisjointSet(int tree[])
{
this.tree=tree;
set(this.tree);
}
public void set(int a[])//初始化所有都是-1 有兩個好處,這樣他們指向-1說明是自己,第二,-1代表當前森林有-(-1)個
{
int l=a.length;
for(int i=0;i<l;i++)
{
a[i]=-1;
}
}
public int search(int a)//返回頭節點的數值
{
if(tree[a]>0)//說明是子節點
{
return tree[a]=search(tree[a]);//路徑壓縮
}
else
return a;
}
public int value(int a)//返回a所在樹的大小(個數)
{
if(tree[a]>0)
{
return value(tree[a]);
}
else
return -tree[a];
}
public void union(int a,int b)//表示 a,b所在的樹合併
{
int a1=search(a);//a根
int b1=search(b);//b根
if(a1==b1) {System.out.println(a+"和"+b+"已經在一棵樹上");}
else {
if(tree[a1]<tree[b1])//這個是負數,為了簡單減少計算,不在呼叫value函式
{
tree[a1]+=tree[b1];//個數相加 注意是負數相加
tree[b1]=a1; //b樹成為a的子樹,直接指向a;
}
else
{
tree[b1]+=tree[a1];//個數相加 注意是負數相加
tree[a1]=b1; //b樹成為a的子樹,直接指向a;
}
}
}
public static void main(String[] args)
{
DisjointSet d=new DisjointSet();
d.union(1,2);
d.union(3,4);
d.union(5,6);
d.union(1,6);
d.union(22,24);
d.union(3,26);
d.union(36,24);
System.out.println(d.search(6)); //頭
System.out.println(d.value(6)); //大小
System.out.println(d.search(22)); //頭
System.out.println(d.value(22)); //大小
}
}
結語
- 並查集屬於簡單但是很高效率的資料結構。在集合中經常會遇到。如果不採用並查集而傳統暴力效率太低,而不被採納。
- 另外,
並查集還廣泛用於迷宮遊戲
中,下面有機會可以介紹用並查集實現一個走迷宮小遊戲。大家歡迎關注! - 最後,歡迎大家關注筆者公眾號,一起學習、交流!
筆者學習資源
也放置公眾號和大家一起分享!
相關推薦
並查集(不相交集合)詳解與java實現
目錄 認識並查集 並查集解析 基本思想 如何檢視a,b是否在一個集合? a,b合併,究竟是a的祖先合併在b的祖先上,還是b的祖先合併在a上? 其他路徑壓縮?
並查集(Union-Find)演算法詳解
並查集(Union-Find)是解決動態連通性問題的一類非常高效的資料結構。本文中,我將盡我所能用最簡單,最清晰的邏輯展示出並查集的構造過程,同時還將對其中的關鍵步驟給出相應的Python程式碼。 動態連通性 可以想象一張地圖上有很多點,有些點之間是有道
[從今天開始修煉資料結構]圖的最短路徑 —— 迪傑斯特拉演算法和弗洛伊德演算法的詳解與Java實現
在網圖和非網圖中,最短路徑的含義不同。非網圖中邊上沒有權值,所謂的最短路徑,其實就是兩頂點之間經過的邊數最少的路徑;而對於網圖來說,最短路徑,是指兩頂點之間經過的邊上權值之和最少的路徑,我們稱路徑上第一個頂點是源點,最後一個頂點是終點。 我們講解兩種求最短路徑的演算法。第一種,從某個源點到其餘各頂點的最短路徑
HDU-1558,Segment set,並查集+線段相交模擬
Segment set Time Limit: 3000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others) Total Submission(s): 5033 &
BZOJ4358: permu(帶撤銷並查集 不刪除莫隊)
++ space freopen class c++ push begin lock con 題意 題目鏈接 Sol 感覺自己已經老的爬不動了。。 想了一會兒,大概用個不刪除莫隊+帶撤銷並查集就能搞了吧,\(n \sqrt{n} logn\)應該卡的過去 不過不刪除莫隊咋寫
【集合詳解】Java集合總結(下)-常用集合類對比
今天我們主要看一張圖。 圖是無意中在網上發現的,個人覺得非常好。(時間久了就忘了出處,請原創原諒~~) 我們還是從左到右分析。 ①所有的類都用到Iterator則說明所有的集合類都有遍歷集合的方法。 ②LinkedList除了繼承AbstractSe
並查集的簡介及其C/C++程式碼的實現(某公司招聘筆試試題)
當年, 我在一個公司實習, 某次, 在一次演算法交流的過程中, 我第一次聽到了並查集這個看似高大上的概念, 也再一次感覺到了自己的無知。 對於一個非計算機專業的人來說, 你跟他說並查集, 就有點像你對著計算機專業的人說Gibbs現象或者FFT一
【集合詳解】Java集合總結(中)-Map家族
接上文,本篇部落格我們接著談論有關集合的內容。 java所有的集合分成三大類。Set類似罐子,把一個物件新增到Set集合時,Set集合無法記住新增這個元素的順序,所以Set裡的元素不能重複。List集合非常想一個數組,可以記住每次新增元素的順序,且List的長
BFS和DFS詳解以及java實現(轉載)
作者: Leo-Yang 原文都先發布在作者個人部落格: http://www.leoyang.net/ 本文版權歸作者和部落格園共有,歡迎轉載,但未經作者同意必須保留此段宣告,且在文章頁面明顯位置給出原文連線,否則保留追究法律責任的權利. 前言
希爾排序超詳解及其java實現
希爾排序雖然已經十分古老了,但其思想確實十分值得我們學習,非常的巧妙 雖然很多資料說希爾排序是叫shell的人提出來的,我個人卻十分好奇,shell的英文好意為殼的意思,感覺希爾排序的思想就像一層層的殼一樣,從內到外越來越大,當然這是我胡謅的,具體原理如下(用的一個例項進行說明的): 原理:
【資料結構與演算法】之排序全家桶(十大排序詳解及其Java實現)---第七篇
本篇文章彙總了10種場常見的排序演算法,篇幅較長,可以通過下面的索引目錄進行定位查閱: 7、桶排序 一、排序的基本概念 1、排序的定義 排序:就是使一串記錄,按照其中的某個或者某些關鍵字的大小,遞增或遞減的排列起來
微博爬蟲“免登入”技巧詳解及 Java 實現
一、微博一定要登入才能抓取? 目前,對於微博的爬蟲,大部分是基於模擬微博賬號登入的方式實現的,這種方式如果真的運營起來,實際上是一件非常頭疼痛苦的事,你可能每天都過得提心吊膽,生怕新浪爸爸把你的那些賬號給封了,而且現在隨著實名制的落地,獲得賬號的渠道估計也會變得越
基數排序詳解以及java實現
前言 基數排序(radix sort)又稱桶排序(bucket sort),相對於常見的比較排序,基數排序是一種分配式排序,即通過將所有數字分配到應在的位置最後再覆蓋到原陣列完成排序的過程。我在上一篇講到的計數排序也屬於這種排序模式,上一篇結尾處提到了計數排序的穩定性,即排序前和排序後相同的數字相對位置保持
遺傳演算法詳解及Java實現
遺傳演算法的起源 ========== 20世紀60年代中期,美國密西根大學的John Holland提出了位串編碼技術,這種編碼既適合於變異又適合雜交操作,並且他強調將雜交作為主要的遺傳操作。遺傳演算法的通用編碼技術及簡單有效的遺傳操作為其廣泛的應用和成功
stl map底層之紅黑樹插入步驟詳解與程式碼實現
本篇文章並沒有詳細的講解紅黑樹各方面的知識,只是以圖形的方式對紅黑樹插入節點需要進行調整的過程進行的解釋。 最近在看stl原始碼剖析,看到map底層紅黑樹的實現。為了加深對於紅黑樹的理解就自己動手寫了紅黑樹插入的實現。關於紅黑樹插入節點後破壞紅黑樹性質的幾種情況,可以在網
資料庫連線池詳解與程式碼實現
一、資料庫連線池概念 資料庫連線池:負責分配、管理和釋放資料庫連線,它允許應用程式重複使用一個現有的資料庫連線,而不是再重新建立一個;釋放空閒時間超過最大空閒時間的資料庫連線來避免因為沒有釋放資料庫連線而引起的資料庫連線遺漏。這項技術能明顯提高對資料庫操作的效
BFS和DFS詳解以及java實現
前言 圖在演算法世界中的重要地位是不言而喻的,曾經看到一篇Google的工程師寫的一篇《Get that job at Google!》文章中說到面試官問的問題中幾乎有一半的問題都可以用圖的方法去解決。由此也可以看出圖確實適用範圍確實很廣。 圖的表示 閒話不多說,首先要
GF(p)上的ELGamal型橢圓曲線密碼詳解(Java實現)
出版 his display 集合 避免 其中 密鑰 整數 參考文獻 GitHub 橢圓曲線密碼 橢圓曲線密碼(Elliptic Curve Cryptosystem),簡稱ECC,是Neal Koblitz和Victor Miller於1985年提出的。 研究發
WebView詳解與簡單實現Android與H5互調
本篇文章已授權微信公眾號 guolin_blog (郭霖)獨家釋出 為什麼要學習Android與H5互調? 微信,QQ空間等大量軟體都內嵌了H5,不得不說是一種趨勢。Android與H5互調可以讓我們的實現混合開發,至於混合開發就是在一個App中內嵌
插入排序詳解(Java實現)
一、基本思想 插入排序(Insertion-Sort)的演算法描述是一種簡單直觀的排序演算法。它的工作原理是通過構建有序序列,對於未排序資料,在已排序序列中從後向前掃描,找到相應位置並插入。 二、演算法描述 1.從第一個元素開始,該元素可以認為已經被