1. 程式人生 > 實用技巧 >並查集-Java實現

並查集-Java實現

並查集
借鑑百度百科的解釋,並查集就是在一些有N個元素的集合問題中,開始的時候讓每個元素成為自己的集合,然後按照一定的順序將屬於同一組的元素所在的集合進行合併(合併的是集合),在合併的期間需要方法查詢元素所在的集合。並查集的原理比較簡單,解決的問題的特點是看似並不複雜,但資料量極大。例如:圖的連通子圖問題,一個圖裡面有幾個連通子圖,判斷這幅圖是否連通等。若用正常的資料結構來描述,往往時空複雜度會過高。並查集是一種樹形資料結構,用於處理一些不相交集合的合併和查詢問題。並查集的原理就是朋友的朋友就是我的朋友。
基本
正如名字表達的那樣,並查集需要合併和查詢集合,所以並查集一般需要一個數組和兩個函式:int[] parent, int find(int element)和void unionElements(int firstOne, int secondOne)。
parent陣列用來記錄每個元素的前導點,也就是確定該元素所在的集合id;find函式用來查詢某元素所在的集合id;unionElements用來合併不同的集合。其基本過程如下圖所示。

實現程式碼:

public class UnionFind1 {
    private int[] id; //儲存元素的root
    private int size; //並查集大小
    //構建新的並查集
    public UnionFind1(int size) {
        this.size = size;
        id = new int[size];
        for (int i=0; i<size; i++)
            id[i] = i; //每個元素都指向自己
    }
    //檢視元素所屬的集合
    public int find(int element) {
        return id[element];
    }
    //判斷是否屬於同一集合
    public boolean isConnected(int firElement, int secElement) {
        return find(firElement) == find(secElement);
    }
    //合併兩個集合
    public void unionElements(int firElement, int secElement) {
        int firUnion = find(firElement);
        int secUnion = find(secElement);
        if(firUnion != secUnion) {
            //合併效率低下,合併一次是O(n)的複雜度
            for(int i=0; i<this.size; i++) {
                if(id[i] == firUnion) {
                    id[i] = secUnion;
                }
            }
        }
    }
    //列印元素
    private void printSet() {
        for (int id : this.id)
            System.out.print(id + " ");
        System.out.println();
    }
    //入口
    public static void main(String[] args) {
        int n = 10;
        UnionFind1 union = new UnionFind1(n);
        System.out.println("初始化: ");
        union.printSet();

        System.out.println("連線5 6");
        union.unionElements(5, 6);
        System.out.println("連線1 2 ");
        union.unionElements(1, 2);
        System.out.println("連線2 3");
        union.unionElements(2, 3);
        System.out.println("連線1 4");
        union.unionElements(1, 4);
        System.out.println("連線1 5");
        union.unionElements(1, 5);

        System.out.println("最終結果: ");
        union.printSet();

        System.out.println("1 6 是否連線: " + union.isConnected(1, 6));
        System.out.println("1 8 是否連線: " + union.isConnected(1, 8));
        System.out.println("1 4 是否連線: " + union.isConnected(1, 4));
    }
}
Output:
初始化: 
0 1 2 3 4 5 6 7 8 9 
連線5 6
連線1 2 
連線2 3
連線1 4
連線1 5
最終結果: 
0 6 6 6 6 6 6 7 8 9 
1 6 是否連線: true
1 8 是否連線: false
1 4 是否連線: true

優化1
上述的並查集合並時候的複雜度是O(n)的,現在對其改進,在合併的時候,當前集合的爸爸去當別人的兒子,當前集合其他元素的爸爸(前導點)不變,這樣的話,需要改變查詢的方式,因為對某個集合來說,最終的爸爸只有一個。例如對於下面這個陣列集合:
元素:0 1 2 3
爸爸:1 2 3 3
查詢元素0和1的"爸爸",應該是3而不是1和2,所以find的尋找方式應該改變,應該找到最終的爸爸(元素和爸爸是同一個的點)。這種方式合併的複雜度下降了,但是find的複雜度增加了。
實現程式碼:

public class UnionFind2 {
    private int[] id;
    private int size;
    public UnionFind2(int size) {
        this.size = size;
        id = new int[size];
        for (int i=0; i<size; i++)
            id[i] = i;
    }
    //找到最終的root
    public int find(int element) {
        while(element != id[element])
            element = id[element];
        return element;
    }
    public boolean isConnected(int firElement, int secElement)
    { return find(firElement) == find(secElement); }
    public void unionElements(int firElement, int secElement) {
        int firUion = find(firElement);
        int secUion = find(secElement);
        if (firUion == secUion)
            return;
        id[firUion] = secUion;
    }
    private void printSet() {
        for (int id : this.id)
            System.out.print(id + " ");
        System.out.println();
    }
    public static void main(String[] args) {
        int n = 10;
        UnionFind2 union = new UnionFind2(n);
        System.out.println("初始化: ");
        union.printSet();

        System.out.println("連線5 6");
        union.unionElements(5, 6);
        System.out.println("連線1 2 ");
        union.unionElements(1, 2);
        System.out.println("連線2 3");
        union.unionElements(2, 3);
        System.out.println("連線1 4");
        union.unionElements(1, 4);
        System.out.println("連線1 5");
        union.unionElements(1, 5);

        System.out.println("最終結果: ");
        union.printSet();

        System.out.println("1 6 是否連線: " + union.isConnected(1, 6));
        System.out.println("1 8 是否連線: " + union.isConnected(1, 8));
        System.out.println("1 4 是否連線: " + union.isConnected(1, 4));
    }
}
Output:
初始化: 
0 1 2 3 4 5 6 7 8 9 
連線5 6
連線1 2 
連線2 3
連線1 4
連線1 5
最終結果: 
0 2 3 4 6 6 6 7 8 9 
1 6 是否連線: true
1 8 是否連線: false
1 4 是否連線: true

優化2
優化1的修改方案,是犧牲查詢函式的複雜度來換取合併函式複雜度的下降,並且還有引入一個新的問題,就是合併後的陣列很可能會達到線性連結串列的狀態,例如:
元素:0 1 2 3 4 5 6 7 8 9
爸爸:1 2 3 4 5 6 7 8 9 9
這樣畫出來的連通子圖是一條連結串列來的,這種原因是合併方式不合理造成的。所以第二種優化的方式可從合併方式下手,引入一個權重來衡量到底誰應該當爸爸。有兩種權重可供選擇,一種是重量,一種是高度。
重量(數目):就是集合爸爸底下有多少數目的子孫;高度(代,箭頭數):就是集合爸爸底下有多少代子孫。
基於重量,誰重誰當爸爸。
實現程式碼:

public class UnionFind3 {
    private int[] id;
    private int[] weight;
    private int size;
    public UnionFind3(int size) {
        this.size = size;
        this.id = new int[size];
        this.weight = new int[size];
        for (int i=0; i<size; i++) {
            this.id[i] = i;
            this.weight[i] = 1; //初始化為1個元素
        }
    }
    public int find(int element) {
        while(element != id[element]){
            element = id[element];
        }
        return element;
    }
    public boolean isConnected(int firElement, int secElement) {
        return find(firElement) == find(secElement);
    }
    public void unionElements(int firElement, int secElement) {
        int firUion = find(firElement);
        int secUion = find(secElement);
        if(firUion == secUion)
            return;
        //減少find的查詢時間,誰重誰是爸爸
        if(weight[firUion] > weight[secUion]) {
            id[secUion] = firUion;
            weight[firUion] += weight[secUion];
        }
        else {
            id[firUion] = secUion;
            weight[secUion] += weight[firUion];
        }
    }
    private void printSet() {
        for (int id : this.id)
            System.out.print(id + " ");
        System.out.println();
    }
    public static void main(String[] args) {
        int n = 10;
        UnionFind3 union = new UnionFind3(n);
        System.out.println("初始化: ");
        union.printSet();

        System.out.println("連線5 6");
        union.unionElements(5, 6);
        System.out.println("連線1 2 ");
        union.unionElements(1, 2);
        System.out.println("連線2 3");
        union.unionElements(2, 3);
        System.out.println("連線1 4");
        union.unionElements(1, 4);
        System.out.println("連線1 5");
        union.unionElements(1, 5);

        System.out.println("最終結果: ");
        union.printSet();

        System.out.println("1 6 是否連線: " + union.isConnected(1, 6));
        System.out.println("1 8 是否連線: " + union.isConnected(1, 8));
        System.out.println("1 4 是否連線: " + union.isConnected(1, 4));
    }
}
Output:
初始化: 
0 1 2 3 4 5 6 7 8 9 
連線5 6
連線1 2 
連線2 3
連線1 4
連線1 5
最終結果: 
0 2 2 2 2 6 2 7 8 9 
1 6 是否連線: true
1 8 是否連線: false
1 4 是否連線: true

基於高度,誰子孫代數多誰當爸爸。
實現程式碼:

public class UnionFind4 {
    private int[] id;
    private int[] height;
    private int size;
    public UnionFind4(int size) {
        this.size = size;
        this.id = new int[size];
        this.height = new int[size];
        for (int i=0; i<size; i++) {
            id[i] = i;
            height[i] = 1;
        }
    }
    public int find(int element) {
        while(element != id[element])
            element = id[element];
        return element;
    }
    public boolean isConnected(int fir, int sec) {
        return find(fir) == find(sec);
    }
    public void unionElements(int fir, int sec) {
        int firUion = find(fir);
        int secUion = find(sec);
        if(firUion == secUion)
            return;
        //使用高度決定誰被誰插入,減少find的時間
        if(height[firUion] > height[secUion])
            id[secUion] = firUion;
        else if(height[firUion] < height[secUion])
            id[firUion] = secUion;
        else {
            id[firUion] = secUion;
            height[secUion]++;
        }
    }
    private void printSet() {
        for (int id : this.id)
            System.out.print(id + " ");
        System.out.println();
    }
    public static void main(String[] args) {
        int n = 10;
        UnionFind4 union = new UnionFind4(n);
        System.out.println("初始化: ");
        union.printSet();

        System.out.println("連線5 6");
        union.unionElements(5, 6);
        System.out.println("連線1 2 ");
        union.unionElements(1, 2);
        System.out.println("連線2 3");
        union.unionElements(2, 3);
        System.out.println("連線1 4");
        union.unionElements(1, 4);
        System.out.println("連線1 5");
        union.unionElements(1, 5);

        System.out.println("最終結果: ");
        union.printSet();

        System.out.println("1 6 是否連線: " + union.isConnected(1, 6));
        System.out.println("1 8 是否連線: " + union.isConnected(1, 8));
        System.out.println("1 4 是否連線: " + union.isConnected(1, 4));
    }
}
Output:
初始化: 
0 1 2 3 4 5 6 7 8 9 
連線5 6
連線1 2 
連線2 3
連線1 4
連線1 5
最終結果: 
0 2 6 2 2 6 6 7 8 9 
1 6 是否連線: true
1 8 是否連線: false
1 4 是否連線: true

優化3
不管是基於重量還是高度,並查集還是有可能會出現深的節點,這時候可以進行干預,進行路徑壓縮,具體的方法就是在每一步的查詢操作進行壓縮,讓當前元素的"爸爸"升級成"爺爺",這種路徑壓縮只能在基於重量的並查集實現,因為在壓縮的時候,當前集合的重量是不會變的,但是高度很有可能改變。
實現程式碼:

public class UnionFind5 {
    private int[] id;
    private int[] weight;
    private int size;
    public UnionFind5(int size) {
        this.size = size;
        this.id = new int[size];
        this.weight = new int[size];
        for (int i=0; i<size; i++) {
            id[i] = i;
            weight[i] = 1;
        }
    }
    //路徑壓縮,指向自己爸爸的爸爸,進一步壓縮
    public int find(int element) {
        while(element != id[element]) {
            id[element] = id[id[element]];
            element = id[element];
        }
        return element;
    }
    public boolean isConnected(int fir, int sec) {
        return find(fir) == find(sec);
    }
    public void unionElements(int fir, int sec) {
        int firUion = find(fir);
        int secUion = find(sec);
        if (firUion == secUion)
            return;
        if (weight[firUion] > weight[secUion]) {
            id[secUion] = firUion;
            weight[firUion] += weight[secUion];
        }
        else {
            id[firUion] = secUion;
            weight[secUion] += weight[firUion];
        }
    }
    private void printSet() {
        for (int id : this.id)
            System.out.print(id + " ");
        System.out.println();
    }
    public static void main(String[] args) {
        int n = 10;
        UnionFind5 union = new UnionFind5(n);
        System.out.println("初始化: ");
        union.printSet();

        System.out.println("連線5 6");
        union.unionElements(5, 6);
        System.out.println("連線1 2 ");
        union.unionElements(1, 2);
        System.out.println("連線2 3");
        union.unionElements(2, 3);
        System.out.println("連線1 4");
        union.unionElements(1, 4);
        System.out.println("連線1 5");
        union.unionElements(1, 5);

        System.out.println("最終結果: ");
        union.printSet();

        System.out.println("1 6 是否連線: " + union.isConnected(1, 6));
        System.out.println("1 8 是否連線: " + union.isConnected(1, 8));
        System.out.println("1 4 是否連線: " + union.isConnected(1, 4));
    }
}
Output:
初始化: 
0 1 2 3 4 5 6 7 8 9 
連線5 6
連線1 2 
連線2 3
連線1 4
連線1 5
最終結果: 
0 2 2 2 2 6 2 7 8 9 
1 6 是否連線: true
1 8 是否連線: false
1 4 是否連線: true

這篇部落格主要是方便自己日後複習和檢視使用,主要參考了下面這篇部落格:
https://www.cnblogs.com/noKing/p/8018609.html
下面還有一篇關於並查集的概念解釋得不錯的概念分享給大家:
https://www.cnblogs.com/-new/p/6662301.html
謝謝大家,這是本人的第一篇技術部落格,歡迎大家批評指正,轉載註明出處就行。