1. 程式人生 > >論文總結:Freeway:自適應地隔離大象流和老鼠流在不同的路徑上傳輸

論文總結:Freeway:自適應地隔離大象流和老鼠流在不同的路徑上傳輸

摘要-今天的資料使用者之間的網路資源競爭非常激烈,長壽命的大象流和延遲敏感的老鼠流之間的競爭非常激烈。對於這兩類流來說,分別實現高吞吐量和低延遲的目標需要妥協,目前還沒有成功的研究是因為沒有區別對待大象流和老鼠流,而都當成一種流量進行路由。當前的資料中心通常採用基於CLOS的拓撲結構,例如FAT樹、VL2,因此在任意一對源和目標之間存在多條最短路徑。在本文中,我們利用這一觀察,提出了一種流量排程方案-Freeway,將傳輸路徑自適應地劃分為低延遲路徑和高吞吐量路徑。並基於這些分離的傳輸路徑,提出了不同的特定於流型別的排程轉發方法,以充分利用頻寬。模擬結果表明,與Hedera相比,Freeway使老鼠流延遲降低了85.8%,吞吐量提高了9.2%。

方案思路介紹:

資料中心的流量主要包括兩種型別的流量:大象流和老鼠流。大象流需要大的穩定頻寬才能在沒有特定期限的情況下實現高吞吐量。老鼠流對延遲敏感,並且通常具有期限限制。Freeway[7]提出了一種集中演算法,以滿足老鼠流量和大象流量的不同要求。首先,它將路徑動態劃分為低延遲鏈路(LOL)和由高吞吐鏈路(HOL)。LOL和HOL的比率根據路徑利用率而變化,即,當一半LOL的鏈路利用率超過閾值時,HOL變為LOL,反之亦然。然後,老鼠流和大象流在末端宿主處分化。大象流在傳送之前與控制器交換他們的交通訊息,其他流被視為老鼠流。然後老鼠流和大象流分別分配給LOL和HOL路徑。使用靜態機制(如ECMP)直接傳輸老鼠流,並且由中央控制器排程大象流。

排程與轉發過程

 

重點思路詳細介紹:

路徑定義:

Low latency path:由低延遲定向鏈路(LOL)組成。LOL在其輸入/輸出/共享緩衝區中保持超低利用率,以減少包緩衝延遲。在這些路徑上只能傳輸老鼠流。

High throughput path:由高吞吐量的面向連結(HOL)組成。HOL在緩衝區中維護長佇列,提供高吞吐量,從而充分挖掘潛在的頻寬資源。只有象流才能通過高吞吐量路徑傳輸。 

 

路徑動態劃分演算法:

我們演算法的目的是先為每對伺服器提供足夠的低延遲路徑,然後充分利用剩餘路徑提供高吞吐量。為了實現這一目標,該演算法需要滿足兩個約束:

約束1:在每對伺服器之間至少有一個低延遲路徑和一個高吞吐量路徑。

約束2:基於實時老鼠流量,動態新增或刪除低延遲路徑.

對於一個k-ary的Fat-tree拓撲為了滿足約束1,我們首先將第一個k/2路徑劃分為低延遲路徑

劃分方法:

對於每個tor對,我們計算鏈路對其所有低延遲路徑的利用率。如果平均鏈路對一條路徑的緩衝區利用率超過LOL的閾值,則假設該路徑擁塞;而如果平均緩衝區佔用率低於閾值,則假設該路徑是空閒的。因此,對於tor對,如果超過半數的低延遲路徑被阻塞,則應該新增一個新的低延遲路徑。另一方面,如果超過一半的低延遲路徑是空閒的,則應該刪除低延遲路徑。

流量排程與轉發:

大象流通常將有幾MB~GB的資料位元組,佔資料中心總流量總數的80%以上。然而,通常由虛擬機器遷移和資料備份服務等應用程式生成的大象流沒有嚴格的完成期限。因此,大象流可以進行集中式排程,從全域性角度進行優化。

如何判斷大象流:

在主機發送一個大的flow(例如超過10 Mb)之前,它應該向控制器傳送一個“握手”分組,以聲稱flow是大象流,如圖所示。“握手”包含flow的基本資訊,包括流大小、預期傳送速率等。

一旦控制器接收到“握手”資料包,它就開始計算flow的最佳路徑。基於從握手包中獲得的tor對,控制器可以為flow選擇可用的高吞吐量路徑。在多條路徑上平均分割流量,但不超過各鏈路的容量,稱為多商品flow(Mcf)問題,即NP-完全問題。這個問題現在可以形式化為線性規劃模型,如eq所示。

與在傳送大象流之前傳送“握手”資料包不同,老鼠flOWS是由主機直接傳送的(圖中的B1)。如前所述,路徑分割演算法為基於老鼠流的每個tor對提供了足夠的低延遲路徑。控制器不計算每個老鼠流的路徑,而是為每個tor對的低延遲路徑設定flow條目。如果flow的目的地地址與tor的子網地址匹配,則交換機將把flow轉發到所有可用的低延遲輸出鏈路(圖b2)中最不擁擠的輸出鏈路。

優缺點:

參考文獻中的模擬顯示,與ECMP和Hedera相比,Freeway實現了更高的吞吐量和更低的延遲。它還與PerPktLB(一種最佳的每資料包負載均衡機制)密切相關,但PerPktLB在實際網路中遭受了極大的資料包重新排序問題,這將導致顯著的TCP效能下降。Freeway是網路利用率和流量要求之間的權衡。Freeway的次優效能是由路徑選擇程式引起的。實際上,即使所有低延遲路徑的鏈路利用率都超過50%,仍然有剩餘容量來傳輸大象流量,但Freeway仍然沒有使用這些容量。雖然不是最優的,但Freeway可以滿足目標流量的大多數期限和吞吐量要求,並且即使存在鏈路故障也是穩定的。

Freeway的對比實驗結果圖