Bellman-Ford 演算法及其優化以及SPFA
Bellman-Ford演算法與另一個非常著名的Dijkstra演算法一樣,用於求解單源點最短路徑問題。Bellman-ford演算法除了可求解邊權均非負的問題外,還可以解決存在負權邊的問題(意義是什麼,好好思考),而Dijkstra演算法只能處理邊權非負的問題,因此 Bellman-Ford演算法的適用面要廣泛一些。但是,原始的Bellman-Ford演算法時間複雜度為 O(VE),比Dijkstra演算法的時間複雜度高,所以常常被眾多的大學演算法教科書所忽略,就連經典的《演算法導論》也只介紹了基本的Bellman-Ford演算法,在國內常見的基本資訊學奧賽教材中也均未提及,因此該演算法的知名度與被掌握度都不如Dijkstra
Bellman-Ford演算法思想
Bellman-Ford演算法能在更普遍的情況下(存在負權邊)解決單源點最短路徑問題。對於給定的帶權(有向或無向)圖 G=(V,E),其源點為s,加權函式 w是邊集 E 的對映。對圖G執行Bellman-Ford演算法的結果是一個布林值,表明圖中是否存在著一個從源點s可達的負權迴路。若不存在這樣的迴路,演算法將給出從源點s到圖G的任意頂點v的最短路徑d[v]。
Bellman-Ford演算法流程分為三個階段:
(1) 初始化:將除源點外的所有頂點的最短距離估計值 d[v] ←+∞, d[s] ←0;
(2) 迭代求解:反覆對邊集E中的每條邊進行鬆弛操作,使得頂點集V中的每個頂點v的最短距離估計值逐步逼近其最短距離;(執行|v|-1次)
(3) 檢驗負權迴路:判斷邊集E中的每一條邊的兩個端點是否收斂。如果存在未收斂的頂點,則演算法返回false,表明問題無解;否則演算法返回true,並且從源點可達的頂點v的最短距離儲存在 d[v]中。
演算法描述如下:
Bellman-Ford(G,w,s) :boolean //圖G ,邊集函式 w ,s為源點
1 for each vertex v ∈ V(G) do //初始化 1階段
2 d[v] ←+∞
3 d[s] ←0; //1階段結束
4 for i=1 to |v|-1 do //2階段開始,雙重迴圈。
5 for each edge(u,v) ∈E(G) do //邊集陣列要用到,窮舉每條邊。
6 If d[v]> d[u]+ w(u,v) then //鬆弛判斷
7 d[v]=d[u]+w(u,v) //鬆弛操作 2階段結束
8 for each edge(u,v) ∈E(G) do
9 If d[v]> d[u]+ w(u,v) then
10 Exit false
11 Exit true
下面給出描述性證明:
首先指出,圖的任意一條最短路徑既不能包含負權迴路,也不會包含正權迴路,因此它最多包含|v|-1條邊。
其次,從源點s可達的所有頂點如果存在最短路徑,則這些最短路徑構成一個以s為根的最短路徑樹。Bellman-Ford演算法的迭代鬆弛操作,實際上就是按頂點距離s的層次,逐層生成這棵最短路徑樹的過程。
在對每條邊進行1 遍鬆弛的時候,生成了從s出發,層次至多為1的那些樹枝。也就是說,找到了與s至多有1條邊相聯的那些頂點的最短路徑;對每條邊進行第2遍鬆弛的時候,生成了第2層次的樹枝,就是說找到了經過2條邊相連的那些頂點的最短路徑……。因為最短路徑最多隻包含|v|-1 條邊,所以,只需要迴圈|v|-1 次。
每實施一次鬆弛操作,最短路徑樹上就會有一層頂點達到其最短距離,此後這層頂點的最短距離值就會一直保持不變,不再受後續鬆弛操作的影響。(但是,每次還要判斷鬆弛,這裡浪費了大量的時間,怎麼優化?單純的優化是否可行?)
如果沒有負權迴路,由於最短路徑樹的高度最多隻能是|v|-1,所以最多經過|v|-1遍鬆弛操作後,所有從s可達的頂點必將求出最短距離。如果 d[v]仍保持 +∞,則表明從s到v不可達。
如果有負權迴路,那麼第 |v|-1 遍鬆弛操作仍然會成功,這時,負權迴路上的頂點不會收斂。
例如對於上圖,邊上方框中的數字代表權值,頂點A,B,C之間存在負權迴路。S是源點,頂點中數字表示執行Bellman-Ford演算法後各點的最短距離估計值。
此時d[a] 的值為1,大於d[c]+w(c,a)的值-2,由此d[a]可以鬆弛為-2,然後d[b]又可以鬆弛為-5,d[c]又可以鬆弛為-7.下一個週期,d[a]又可以更新為更小的值,這個過程永遠不會終止。因此,在迭代求解最短路徑階段結束後,可以通過檢驗邊集E的每條邊(u,v)是否滿足關係式 d[v]> d[u]+ w(u,v) 來判斷是否存在負權迴路。
二、基本 Bellman-Ford 演算法的 pascal實現。
見 bellmanford.pas 檔案
三、基本演算法之上的優化。
分析 Bellman-Ford演算法,不難看出,外層迴圈(迭代次數)|v|-1實際上取得是上限。由上面對演算法正確性的證明可知,需要的迭代遍數等於最短路徑樹的高度。如果不存在負權迴路,平均情況下的最短路徑樹的高度應該遠遠小於 |v|-1,在此情況下,多餘最短路徑樹高的迭代遍數就是時間上的浪費,由此,可以依次來實施優化。
從細節上分析,如果在某一遍迭代中,演算法描述中第7行的鬆弛操作未執行,說明該遍迭代所有的邊都沒有被鬆弛。可以證明(怎麼證明?):至此後,邊集中所有的邊都不需要再被鬆弛,從而可以提前結束迭代過程。這樣,優化的措施就非常簡單了。
設定一個布林型標誌變數 relaxed,初值為false。在內層迴圈中,僅當有邊被成功鬆弛時,將 relaxed 設定為true。如果沒有邊被鬆弛,則提前結束外層迴圈。這一改進可以極大的減少外層迴圈的迭代次數。優化後的 bellman-ford函式如下。
function bellmanford(s:longint):boolean;
begin
for i:=1 to nv do
d[i]:=max;
d[s]:=0;
for i:=1 to nv-1 do
begin
relaxed:=false;
for j:=1 TO ne do
if(d[edges[j].s]<>max) and (d[edges[j].e]>d[edges[j].s]+edges[j].w)
then begin
d[edges[j].e]:=d[edges[j].s]+edges[j].w ;
relaxed:=true;
end;
if not relaxed then break;
end;
for i:=1 to ne do
if d[edges[j].e]>d[edges[j].s]+edges[j].w then exit(false);
exit(true);
end;
這樣看似平凡的優化,會有怎樣的效果呢?有研究表明,對於隨機生成資料的平均情況,時間複雜度的估算公式為
1.13|E| if |E|<|V|
0.95*|E|*lg|V| if |E|>|V|
優化後的演算法在處理有負權迴路的測試資料時,由於每次都會有邊被鬆弛,所以relaxed每次都會被置為true,因而不可能提前終止外層迴圈。這對應了最壞情況,其時間複雜度仍舊為O(VE)。
優化後的演算法的時間複雜度已經和用二叉堆優化的Dijkstra演算法相近了,而編碼的複雜程度遠比後者低。加之Bellman-Ford演算法能處理各種邊值權情況下的最短路徑問題,因而還是非常優秀的。Usaco3.2.6 的程式見bellmanford_1.pas
四、SPFA 演算法
SPFA是目前相當優秀的求最短路徑的演算法,值得我們掌握。
SPFA對Bellman-Ford演算法優化的關鍵之處在於意識到:只有那些在前一遍鬆弛中改變了距離估計值的點,才可能引起他們的鄰接點的距離估計值的改變。因此,用一個先進先出的佇列來存放被成功鬆弛的頂點。初始時,源點s入隊。當佇列不為空時,取出對首頂點,對它的鄰接點進行鬆弛。如果某個鄰接點鬆弛成功,且該鄰接點不在佇列中,則將其入隊。經過有限次的鬆弛操作後,佇列將為空,演算法結束。SPFA演算法的實現,需要用到一個先進先出的佇列 queue 和一個指示頂點是否在佇列中的標記陣列 mark。為了方便查詢某個頂點的鄰接點,圖採用臨界表儲存。
程式儲存在 spfa.pas中。以usaco 3.2.6 試題2為例。用鄰接表寫的程式。
需要注意的是:僅當圖不存在負權迴路時,SPFA能正常工作。如果圖存在負權迴路,由於負權迴路上的頂點無法收斂,總有頂點在入隊和出隊往返,佇列無法為空,這種情況下SPFA無法正常結束。
判斷負權迴路的方案很多,世間流傳最廣的是記錄每個結點進隊次數,超過|V|次表示有負權
還有一種方法為記錄這個結點在路徑中處於的位置,ord[i],每次更新的時候ord[i]=ord[x]+1,若超過|V|則表示有負圈.....
其他方法還有很多,我反倒覺得流傳最廣的方法是最慢的.......
關於SPFA的時間複雜度,不好準確估計,一般認為是 O(kE),k是常數
五、時間效率實測
上述介紹的Bellman-Ford演算法及兩種的優化,只是在理論上分析了時間複雜度,用實際的資料測試,會有什麼結果呢?為此,我們選擇 usaco 3.2.6。
Spfa的時間效率還是很高的。並且spfa的程式設計複雜度要比Dijksta+heap優化要好的多。
六、結論
經過優化Bellman-Ford演算法是非常優化的求單源最短路徑的演算法,SPFA時間效率要優於第一種優化形式,但第一種優化形式的編碼複雜度低於SPFA。兩種優化形式的程式設計複雜度都低於Dijkstra演算法。如果在判斷是否存在負權迴路,推薦使用第一種優化形式,否則推薦使用SPFA。