1. 程式人生 > >文獻:Technology-related Disasters:A Survey toward Disaster-resilient Software Defined Networks

文獻:Technology-related Disasters:A Survey toward Disaster-resilient Software Defined Networks

利用 tro direct 其他 switch war 檢測 控制器 有一個

DISASTER的定義和影響(本文中)

定義範圍:

  • 自然災害,比如洪水、地震等造成一定範圍類的節點故障;
  • 惡意攻擊,DDOS攻擊或者電磁脈沖攻擊造成節點故障;
  • 技術相關的問題,配置錯誤或者誤操作等;

影響:

  • 斷電;
  • 硬件問題;
  • 某個節點宕機後導致的級聯問題;
    • 級聯故障:在一個網絡中,由於其中網絡節點宕機,導致數據分流到其他節點進而導致其他節點負載加大,甚至出現故障。

SDN相關的故障:

  • DOS導致的節點癱瘓,包括控制平面的節點;
  • 惡意應用;
  • Control-Switch的通訊不可靠(由於災害等原因);

原文還將沖突的流規則認為是故障的一種,但是很多OpenFLow交換機都有各自的匹配順序用來解決沖突的流規則,故在此不討論

數據平面

??對於數據平面,雖然可以利用上層的網絡應用來解決,但是將故障網絡底層的情況交給控制平面再由控制平面做出決策的時延太大(超過50ms);
??使用BFD(Bidirectional Forwarding Detection)來檢測Source-Destance,或者單個鏈路的故障,之後利用FF機制重路由到預先設置好的備用路徑;即,這類方法需要有一個活躍的監視協議以及計算最優路徑的算法;

控制平面

??控制平面對於故障的恢復主要在分割數據平面,為每個子數據平面(域)分配一個控制器,這些控制器互為主備。這樣的多控制器設計需要考慮控制器之間的信息交互。

文獻:Technology-related Disasters:A Survey toward Disaster-resilient Software Defined Networks