1. 程式人生 > 其它 >自動駕駛網路大學課程W5L1

自動駕駛網路大學課程W5L1

上週課程學習的是資料網路裝置中的兩個關鍵器件PP和TM的設計思路,兩篇材料分別介紹了可程式設計的PP報文處理器的設計和可程式設計的TM流量管理晶片的設計。

本週第一課的內容回到了網路的控制協議方面。

文章研究了視訊網站如何採用可變速率編碼,為不同連線頻寬的使用者根據網路頻寬情況傳送不同編碼速率的視訊訊號,這個功能在各個視訊網站上比較常見的體現是使用者可以自己選擇觀看480P畫質的視訊、高清視訊、還是自動模式。

目前視訊網站的自動模式採取的方法是基於客戶端對網路頻寬的探測,然後通知伺服器端無縫改變訊號編碼速率,通過降低頻寬要求來保障視訊的連續性。

文章發現複雜的基於機器學習方法產生的控制策略在效果上不如簡單的基於緩衝區佔用的演算法,出現這種情況的原因是網路狀態變化的影響因素太多、使用者的行為模型太複雜。

文章提出的VBR演算法還是用到了監督學習的方法,只是監督學習只是用於預測切分成小塊的視訊塊的傳送時間。

作者建立了一個電視轉播的網站來獲取實際的資料,並基於實際獲取的資料對視訊塊傳送時間預測器進行訓練。

文章附錄中給出了用於訓練的資料具體包含的內容。

文章的想法不難,但是作者建立的電視轉播網站,開源了獲取的資料,並且和現有演算法的效果進行了比較,內容非常的紮實。

還是放個文章的結論:

計算機網路中的機器學習系統有時根據問題的包含版本或模型版本的結果,將自己描述為達到接近“最優”的效能[25,37,39]。這種方法並不侷限於學術界:2020年初,一家大型視訊流媒體公司宣佈為最佳低延遲ABR方案提供5000美元的獎金,在該方案中,候選人將在一個網路模擬器中進行評估,該模擬器跟蹤不同吞吐量[2]的軌跡。

在本文中,我們建議這些努力可以受益於考慮效能和最優性的更廣泛的概念。在模擬器或模擬器中良好的,甚至接近最佳的效能並不一定能預測在網際網路上的良好效能,因為它具有可變性和重尾分佈。

收集適當的訓練資料(或在RL系統的情況下,訓練環境)來正確地學習和驗證這樣的系統仍然是一個具有挑戰性的問題。

在這篇論文中,我們提出了這樣一個問題:如何才能建立一個學習後的ABR演算法,並在網際網路上穩健地執行?作弊實際上,我們最好的答案是:訓練演算法原位實際部署環境的資料,並使用一個演算法的結構足夠複雜(神經網路),但也很簡單(預測服從監督學習資料,通知一個經典控制器)受益於這樣的培訓。

在過去的一年裡,我們為63,508名使用者提供了38.6年的視訊。會議在不同演算法中以盲法隨機進行,並記錄客戶遙測資料進行分析。Fugu演算法在客觀度量(SSIM、失速時間、SSIM變變性)上穩健地優於其他方案,包括簡單和複雜的方案,並增加了使用者選擇繼續流的持續時間。

我們已經發現Puffer方法是一個強大的網路研究工具——能夠“測量,然後構建”[5]來快速迭代新想法並獲得反饋是令人滿意的。

因此,我們將Puffer開放為一個“開放研究”平臺。與這篇論文一起,我們在Puffer網站上釋出了我們的資料和結果的完整檔案。該系統每週釋出新資料,以及正在進行的實驗的結果總結,其置信區間與本文中的相似。(格式見附錄b)

我們從公共檔案中編輯了一些欄位,以保護參與者的隱私(例如,IP地址),但我們願意與研究人員合作,以聚合的方式訪問這些欄位。Puffer和Fugu也是開源軟體,正如本文中用來準備結果的分析工具一樣。

我們計劃在可行的情況下使用Puffer,並邀請研究人員訓練和驗證新的ABR演算法

控制,網路和吞吐量預測,以及流量的擁塞控制。對於如何設計和部署健壯的Internet學習系統,我們渴望與社群合作並學習他們的想法。