極小連通子圖和極大連通子圖_強連通分量與拓撲排序

阿新 • • 發佈：2021-02-20

前言

由於GacUI裡面開始多處用上拓撲排序，我決定把之前瞎JB搞出來的演算法換掉，換成個正式的。之前我自己弄了個寫起來很簡單的演算法，然後每一處需要用到的地方我就重新做一遍。當然這樣肯定也是不行的，我覺得也差不多積累到重構的臨界點，於是重構一把。

我的需求是要在做拓撲排序的同時，識別出圖的強連通分量。於是在經過短暫的考察之後，我選擇了 Kosaraju's algorithm 。這個演算法設計的很精妙，雖然很簡單，但是令我回味無窮。該演算法claim說自己是線性的，雖然也沒錯，但是實際上為了構造出這個資料結構，本身花費的時間已經超過線性了，所以整個算下來並不是線性的。

GacUI需要用到拓撲排序的地方很多，包括但不限於：

CodePack.exe

一個把一堆C++程式碼打包成幾個成對的h和cpp程式碼的工具。這裡就需要拓撲排序。因為在配置檔案裡（譬如說這個），我只定義了哪一些檔案需要合併。而最後檔案與檔案的#include關係，是自動算出來的。拓撲排序在這裡起到的作用，就是如果排序不成功，那我就要輸出錯誤資訊。

現在我輸出錯誤資訊只是告訴說你錯了，並不能告訴你是誰跟誰搞在一起導致出錯的。強連通分量在這裡就起到了很好的效果，他識別出了迴圈引用的最小的集合，那麼我就可以把這個集合輸出到錯誤資訊裡，這樣你就知道配置檔案裡面哪裡寫的不對。

Workflow 編譯器

Workflow指令碼語言支援C#那樣子的class和struct。class可以繼承，struct可以在成員裡面引用別的struct。如果我們把class a繼承自class b，和struct a用了struct b，都看成a依賴b的話，那麼所有的class或者所有的struct就構成了一個圖。這個圖必須是偏序結構的，否則就意味著，要麼你迴圈繼承class，要麼你虛幻巢狀struct，這都是錯誤的。

那強連通分量是什麼作用呢？其實仍然是為了輸出錯誤資訊。如果你有一個很大的Workflow程式，我告訴你某個class迴圈繼承了自己，看起來其實不是很友好。如果我可以告訴你到底是哪幾個class互相繼承，你改起程式碼來自然就方便多了。每一個強連通分量都代表了一個錯誤資訊，很方便。

Workflow C++程式碼生成器

Workflow生成C++程式碼還有一些額外的要求。譬如說你在GacUI裡面，指明瞭一個視窗的ref.CodeBehind屬性為true，那麼GacUI就會為你這個視窗單獨生成一對C++檔案，否則就全部加進大檔案裡。這樣可以有效減少檔案數量。你需要單獨生成檔案的理由，自然是你需要把自己的C++程式碼合併進這個視窗生成的C++程式碼裡，就像流行的GUI庫編輯器做的那樣。典型的有事件處理函式，或者是你自己用C++新增的成員等等。

這就帶來了兩個問題。第一個問題是，如果你有三個視窗，a繼承出b，而b繼承出c。本來abc都是生成到同一個檔案裡面的，但是後來你給b加上了ref.CodeBehind=true，這會導致c也必須生成到一個獨立的檔案。因為如果ac在一個檔案，b在另一個檔案的話，你就沒法正確#include。

顯然，你ref.CodeBehind=true的一些視窗，使得ref.CodeBehind=false的一些視窗不一定可以全部放到一個頭檔案裡。在這裡識別出強連通分量就可以很好地減少分裂的標頭檔案數量。當然並不是每一個強連通分量就是一個檔案，這樣也是很多餘的。具體的辦法我還沒開始想，不過肯定是水到渠成的問題，因為明顯只要對每一個強連通分量按照一定的規則染色，就搞定了。

第二個問題是，Workflow的類可以有巢狀類，巢狀類也會影響生成檔案的安排，但是就算你只有一個檔案，還會帶來另一個問題。譬如說我有這樣的C++程式碼：

class Fuck : public Bitch::Dung
{
public: class Shit{};
};

class Bitch : public Fuck::Shit
{
public: class Dung{};
};

你會發現，不管你怎麼調整順序，不管你怎麼向前宣告，你都沒辦法讓他編譯通過。當然C#是不會有這個問題的，以C#和COM作為模板的Workflow自然也不會有這個問題。但是你真的這麼寫了，我就沒辦法替你生成C++程式碼。

那麼自然，Workflow的C++程式碼生成器必須在這個時候報錯。這裡我們仍然要進行拓撲排序，但是圖的每一個節點，其實就是每一個top level class和所有內部類的集合。在這裡自然就是{Fuck, Fuck::Shit}以及{Bitch, Bitch::Dung}。在檢查繼承關係之後，我們發現這兩個節點是迴圈引用的，因此會被分配到同一個強連通分量裡。如果排序的結果，有一個強連通分量有超過一個節點的話，那麼就意味著這種程式碼沒辦法生成C++程式碼，因此就可以抱錯了。報錯的時候，我又可以生成好看的錯誤資訊了。

實現

其他的我就不說了，還有很多。如果你們好好看了上面的維基百科的連結，就知道Kosaraju演算法是表達為遞迴的。在敲程式碼之前，我也考慮過到底要不要把遞迴化為迴圈，讓爆棧不那麼容易發生。後來想想算了，因為這裡的遞迴的層數，跟你C++程式碼#include的層數，和類繼承的層數是一致的。如果你的Workflow類一共繼承了1000層，那你也不要怪我GacGen.exe崩潰，我不管的（逃。因此我毅然選擇了遞迴。

Vlpp裡面一共有三個檔案：PartialOrdering.h、PartialOrdering.cpp和TestPartialOrdering.cpp。大家有興趣的話就去看，裡面有實現以及測試用例。

經過我的估算，這個類的三個主要函式的worst case複雜度分別是：

InitWithGroup：O(ElgV)
InitWithFunc：O(V² + ElgV)
Sort：O(V+E)

總的來說，整個東西的複雜度還是會被控制在O(nlgn)或者O(n²)，還行。

之前瞎JB搞得演算法的worst case是O(n³lgn)，看起來很嚇人，不過因為我處理的圖都是稀疏圖，所以平均下來也不會這麼難看。既然已經把靠譜的演算法做進GacUI了，那麼接下來就是把每一處用到垃圾拓撲排序的地方刪掉，用新寫的演算法替換上。

尾聲

寫程式碼真是開心啊，每天都可以找到缺陷可以改進，每天都有程式碼可以寫。希望有我同樣熱情的人，好好學習，不要被一些投機倒把的CS學生，把你們的大學學籍給擠掉，每一個喜歡程式設計的同學最終都能讀上CS專業。

極小連通子圖和極大連通子圖_強連通分量與拓撲排序

前言

CodePack.exe

Workflow 編譯器

Workflow C++程式碼生成器

實現

尾聲

極小連通子圖和極大連通子圖_強連通分量與拓撲排序

微信小程式底部導航和廣告輪播圖3D實現

【強連通分量+縮點+DAGdp/拓撲排序】UVA11324 The Largest Clique

（最詳細合理程式碼）C++實現圖的深度優先遍歷、廣度優先遍歷和拓撲排序演算法

資料結構和演算法學習筆記十:圖的拓撲排序和關鍵路徑

Linux X11獲取螢幕截圖和程式視窗截圖，並通過QPixmap顯示

Endless Walk（拓撲排序、強連通分量）

資料結構-圖程式設計知識詳細總結C++（圖建立、圖遍歷、最短路徑、拓撲排序、關鍵路徑）

Codeforces Round #656 (Div. 3)E. Directing Edges(拓撲排序+構造dag圖)

acwing-239-奇偶遊戲(離散化+字首和+帶權並查集）+acwing164可達性統計（bitset使用+拓撲排序）

圖的拓撲排序

演算法資料結構 | 圖論基礎演算法——拓撲排序

一文講完最基本的圖演算法——圖的儲存、遍歷、最短路徑、最小生成樹、拓撲排序

310最小高度樹（拓撲排序）

圖的拓撲排序問題

演算法——課程表 II（有向圖拓撲排序）

圖-拓撲排序

拓撲排序（DFS和BFS及判斷是否有環）

jav實現有向無環圖拓撲排序

資料結構之“有向圖拓撲排序演算法”

極小連通子圖和極大連通子圖_強連通分量與拓撲排序

前言

CodePack.exe

Workflow 編譯器

Workflow C++程式碼生成器

實現

尾聲

相關推薦