1. 程式人生 > 其它 >Meta Matrix Factorization for Federated Rating Predictions閱讀筆記

Meta Matrix Factorization for Federated Rating Predictions閱讀筆記

動機

本文是2020年SIGIR上的一篇論文。之前的大多數研究聯邦推薦系統的工作忽略了移動裝置的儲存、計算能力、通訊頻寬等方面的限制,本文針對這個問題,提出了MetaMF,它通過為每個移動裝置生成物品私有嵌入向量和預測模型,使移動裝置在使用一個較小的私人化的模型情況下,可以取得一個較好的效果。

演算法

MetaMF主要由三部分組成,分別是協同記憶模組、元推薦模組、預測模組。整體框架如下圖。

協同記憶模組

我們使用\(i_u\)\(i_i\)作為使用者和物品的指示向量,他們是one-hot向量。我們通過\(i_u\)和使用者嵌入矩陣向量\(U\)得到使用者的embedding

接下來,我們再根據一個共享記憶矩陣\(M\)

得到使用者的協同向量\(c_u\),這裡相當於把使用者embedding當成索引

\(M\)中儲存著協同向量。

元推薦模組

我們為每個使用者生成一個私有的物品嵌入矩陣,但是該物品嵌入矩陣過大,直接生成較為困難,我們將其分解為兩個低維矩陣\(I_u^l\)\(I_u^r\)

其中W,U為權重,b是偏置,都是可訓練的。
最終\(I_u\)通過以下公式獲得

私人推薦模組

我們為每個使用者生成一個私人推薦模組,這部分模型是一個多層感知機MLP,我們通過以下公式生成每層神經網路的\(W^u_l\)\(b^u_l\)

其中W和U是權重,b是偏置,這些是可以訓練的。
接下來,我們首先獲得物品的embedding

通過以下步驟來預測使用者u對物品i的評分

損失函式

損失函式兩部分,第一部分是預測模型的損失

第二部分是正則化損失

總的損失為

總體流程

結果

作者在四個資料集上做了實驗,本文提出的MetaMF在各個資料集的表現都超越FedRec(也是一種聯邦推薦),和集中訓練的模型相比,大部分情況下超越了傳統的推薦模型,略遜於NCF和AutoRec。

總結

本文提出的MetaMF為每個使用者生成私有的物品嵌入表示和預測模型,在模型規模較小的情況下保證了模型的效能。本文提出的MetaMF存在一些隱私洩露問題,因為為使用者生成私有的物品嵌入表示和預測模型是在伺服器上完成的。同時,它還存在冷啟動的問題,在使用者擁有個性化資料較少的情況下,模型效能會下降很多。