1. 程式人生 > 其它 >FetchSGD: Communication-Efficient Federated Learning with Sketching

FetchSGD: Communication-Efficient Federated Learning with Sketching

摘要

提出了一種FetchSGD演算法來克服通訊瓶頸,使用 Count Sketch 技術壓縮模型更新,並且利用sketches的可並堆性的優點來合併模型更新。由於 Count Sketch 是線性的,動量和誤差的累積計算可以從客戶端遷移至中央聚合器,克服了稀疏客戶端參與的挑戰,同時保持了高壓縮率和良好的收斂性。

Count Sketch 演算法:基本原理是陣列每個單元維持一個計數器,當資料流的元素雜湊索引到陣列的某個位置,此位置計算器加一。查詢某個元素的出現頻率只需雜湊索引到對應計數器即可。很明顯,由於不同元素可能索引到同一個位置,這種方法得到的計數值一般是偏大的。
hash 函式:即雜湊函式,或叫雜湊函式。它可以將不定長的輸入,通過雜湊演算法轉換成一個定長的輸出,這個輸出就是hash值(雜湊值)。需要注意的是,不同的輸入通過雜湊函式,也可能會得到同一個雜湊值。同樣的物件,必須生產同樣的hashCode,而equals就是用來比較物件是否相同,因此,這兩個函式方法是強相關的。