並查集的簡介及其C/C++程式碼的實現(某公司招聘筆試試題)
當年, 我在一個公司實習, 某次, 在一次演算法交流的過程中, 我第一次聽到了並查集這個看似高大上的概念, 也再一次感覺到了自己的無知。
對於一個非計算機專業的人來說, 你跟他說並查集, 就有點像你對著計算機專業的人說Gibbs現象或者FFT一樣, 你懂的。 後來, 某公司的招聘筆試題目中, 又出現並查集, 讓我們一起來看看這個題目吧:
假如已知有 n 個人和 m 對好友關係 (存於數字 r) 。 如果兩個人是直接或間接的好友 (好友的好友的好友...) , 則認為他們屬於同一個朋友圈,請寫程式求出這 n 個人裡一共有多少個朋友圈。 假如:n = 5 , m = 3 , r = {{1 , 2} , {2 , 3} , {4 , 5}},表示有 5 個人,1 和 2 是好友,2 和 3 是好友,4 和 5 是好友,則 1、2、3 屬於一個朋友圈,4、5 屬於另一個朋友圈,結果為 2 個朋友圈。
其實, 這是個並查集的問題, 比較簡單。
下面, 我們來寫個並查集的程式玩玩, 加深對並查集的理解:
結果為:// taoge的並查集 #include <iostream> using namespace std; #define N 1000 int leader[N + 1] = {0}; // 先搞一個充分大的陣列 // 初始化 void setLeader() { int i = 1; for(i = 1; i <= N; i++) { leader[i] = i; // 初始化時, 將自己初始化為自己的領導 } } // 查詢領導, 看看究竟是誰(實際上, 還可以進行路徑壓縮優化) int findLeader(int n) { int r = n; while(leader[r] != r) { r = leader[r]; // 沒找到的話, 一直往上找 } return r; } // 將兩個領導帶領的團隊融合, 從此, leaderX和leaderY建立了新的統一戰線, 是一個大家庭團隊了 void uniteSet(int leaderX, int leaderY) { leader[leaderX] = leaderY; // leader[leaderY] = leaderX; } // 輸入陣列, 每一行表示一個集合關係, 比如第一行表示3和4屬於一個集合團隊 int input[] = { 3, 4, 4, 2, 7, 6, 5, 1, 3, 9, 11, 8, 6, 10, 9, 13, 11, 12, }; // 測試陣列, 測試每行的兩個整數是否屬於同一個大的家庭團隊 int test[] = { 3, 2, 9, 4, 7, 10, 6, 7, 13, 4, 8, 12, 6, 9, 4, 7, 11, 10, 1, 2, 12, 13, 7, 13, }; int main() { int numberOfSets = 13; // 總共有13個元素, 即1, 2, 3, 4, ...., 13 // 初始化領導 setLeader(); int i = 0; int j = 0; int n = sizeof(input) / sizeof(input[0]) / 2; for(j = 0; j < n; j++) { int u = input[i++]; int v = input[i++]; // 找領導 u = findLeader(u); v = findLeader(v); // 領導不相等, 則融合著兩個團隊, 合二為一 if(u != v) { uniteSet(u, v); numberOfSets--; } } i = 0; n = sizeof(test) / sizeof(test[0]) / 2; for(j = 0; j < n; j++) { int u = test[i++]; int v = test[i++]; // 找領導 u = findLeader(u); v = findLeader(v); // 如果領導不相同, 則不屬於一個團隊; 如果兩個領導相同, 則肯定屬於一個團隊 if(u != v) { cout << "NO" << endl; } else { cout << "YES" << endl; } } // 其實, 經合併後, 最後的集合是4個: // {3, 4, 2, 9, 13}, {7, 6, 10,}, {5, 1}, {11, 8, 12} cout << numberOfSets << endl; return 0; }
YES
YES
YES
YES
YES
YES
NO
NO
NO
NO
NO
NO
4
其實, 並查集很簡單, 無非就是查查並並的操作。 不過, 並查集的思想, 確實很優秀。 要說明的是, 上述程式碼其實可以優化, 比如路徑壓縮等。
如果大家覺得上述程式不太好理解, 那就請參考:http://blog.csdn.net/dellaserss/article/details/7724401這篇博文,那篇博文是轉載的, 寫的通俗易通, 形象生動,可讀性強。 最後, 我把那篇文章的一個圖借鑑過來, 欣賞一下, 挺有意思的(在此, 特別感謝下圖的原作者):
OK, 本文先到此為止。