1. 程式人生 > >快速並查集(Java實現)

快速並查集(Java實現)

       在一些應用的問題中,需將n個不同的元素劃分成一組不相交的集合。開始時,每個元素自成一格單元素集合,然後按一定順序將屬於同一組的元素的集合合併。其間要反覆用到查詢某個元素屬於哪個集合的運算。適合於描述這類問題的抽象資料型別稱為並查集。

1. 並查集的概述

並查集的數學模型是一組不相交的動態集合的集合S={A,B,C,...},它支援以下的運算:

(1)union(A,B):將集合A和B合併,其結果取名為A或B;

(2)find(x):找出包含元素x的集合,並返回該集合的名字。

       在並查集中需要兩個型別的引數:集合名字的型別和元素的型別。在許多情況下,可以用整數作為集合的名字。如果集合中共有n個元素,可以用範圍【1:n】以內的整數表示元素。實現並查集的一個簡單方法是使用陣列表示元素及其所屬子集的關係。

其中,用陣列下標表示元素,用陣列單元記錄該元素所屬的子集名字。如果元素型別不是整型,則可以先構造一個對映,將每個元素對映成一個整數。這種對映可以用散列表或其他方式實現。

2. 並查集的實現

      採用數結構實現並查集的基本思想是,每個集合用一棵樹表示。樹的結點用於儲存集合中的元素名。每個樹結點還存放一個指向其父結點的指標。數根結點處的元素代表該數所表示的集合。利用對映可以找到集合中所對應的數結點。

      父親陣列是實現上述數結構的有效方法。

       Java實現程式碼:

public class UnionFind {
	Node[] node;   //父親陣列
	//並查集中的結點
	private static class Node{
		int parent;
		boolean root;
		
		private Node(){
			parent = 1;
			root = true;
		}
	}
	//將每個元素初始化為一顆單結點樹
	public UnionFind(int n){
		node = new Node[n + 1];
		for(int e= 0; e <= n; e++){
			node[e] = new Node();
		}
	}
}
       find運算就是從元素e相應的結點走到樹根處,找出所在集合的名字。
	public int find(int e){
		while(!node[e].root){
			e = node[e].parent;
		}
		return e;
	}
union運算,合併兩個集合,只要將表示其中一個集合的樹的數根改為表示另一個集合的樹的數根的兒子結點。
	public void union(int a, int b){
		node[a].parent += node[b].parent;
		node[b].root = false;
		node[b].parent = a;
	}

3. 快速並查集的實現

容易看出,在最壞情況下,合併可能使n個結點的樹退化成一條鏈,導致對所有元素各執行一次find將耗時O(n^2)。可做出以下改進來加速find運算。

1.)小樹合併到大樹

在union操作中,將表示小樹的數根改為表示大樹的數根的兒子結點。於是並查集中每個結點至多被移動O(logn)次,從而每個結點到數根的距離不會超過O(logn)。所有,每次find運算只需O(logn)時間。

	/*
	 * 合併兩個集合(加速)
	 * 將表示小樹的數根改為表示大樹的數根的兒子結點
	 */
	public void union(int a, int b){
		if(node[a].parent < node[b].parent){
			node[b].parent += node[a].parent;
			node[a].root = false;
			node[a].parent = a;
		}else{
			node[a].parent += node[b].parent;
			node[b].root = false;
			node[b].parent = a;
		}
	}

2.)路徑壓縮技術

在執行find時,實際上找到了從一個結點到數根的一條路徑。路徑壓縮就是把這條路上所有的結點都提升1層,以加快找到根結點的時間。
	/*
	 * find運算(加速)
	 * 從元素e相應的結點走到樹根處,找出所在集合的名字
	 */
	public int find(int e){
		int current = e, p ,gp;
		/*排除當前結點或其父結點為根的情況後,加速find*/
		if(node[current].root){
			return current;
		}
		p = node[current].parent;
		if(node[current].root){
			return p;
		}
		gp = node[current].parent;
		
		while(true){
			node[current].parent = gp;
			if(node[gp].root){
				return gp;
			}
			current = p;
			p = gp;
			gp = node[p].parent;
		}
	}

       (並查集實現的詳細程式碼及更多相關資料結構的程式碼均在git)

參考資料:

1.《演算法設計與分析》