Fast-adapting and Privacy-preserving Federated Recommender System閱讀筆記

阿新 • • 發佈：2022-05-05

動機

本文是2021年VLDBJ上的一篇論文。在聯邦推薦系統中，存在著資料異質性的問題，一些使用者與物品有很多互動，而一些使用者與物品互動很少，傳統的聯邦推薦利於活躍使用者的推薦，而幾乎忽略那些不活躍的使用者(這部分使用者佔比非常大)。同時，某些惡意使用者還會嘗試獲取使用者私有資訊。為了解決以上問題，本文作者提出了PrivRec和DP-PrivRec模型，DP-PrivRec是PrivRec加入差分隱私技術的模型，可以更好地保護使用者隱私，這裡的保護隱私主要針對降低惡意使用者識別出參與聯邦學習使用者的可能性。

演算法

本文提出的聯邦推薦方法分為兩個階段，第一階段是利用自監督學習獲得物品的embedding，第二階段用基於一階元學習reptile的方法學習推薦模型(PrivRec、DP-PrivRec)。

自監督學習獲取物品表示

這一階段，我們可以利用使用者的互動序列來獲取物品的表示，這裡的互動序列不包含任何使用者資訊。受到BERT啟發，對於一個互動序列X，我們使用一個不再序列中的物品去替代序列中的一個物品，記作，因此，有以下損失函式

\(f_\Sigma\)和\(f_\psi\)是編碼函式，分別學習物品序列和物品的表示。這個式子的目標是最大化正對(\(\hat{X},v_i\))和負對(\(\hat{X},\hat{v}_i\))之間的分數。我認為可以理解為拉近\(v_i\)和序列之中其它item的距離，同時使得\(\hat{v}_i\)和序列中其它item的距離增大。
還可以使用一段序列去替代一段序列，方法與上述類似。
第一階段學到的物品的表示用於第二階段初始化。

PrivRec

PrivRec是一種基於一階元學習reptile的方法。它和FedAvg非常相似，不同的地方在於，在FedAvg中，在客戶端本地訓練時，每個客戶端本地的資料數量會不同，這樣會導致推薦系統會更利於活躍的使用者，而幾乎忽略了不活躍的使用者，而在PrivRec中，每個客戶端本地訓練的資料數量相同(通過取樣相同數量的互動物品來保證訓練資料數量相同)，從而避免出現上述問題。
整體的流程是首先採樣M個客戶端，向每個客戶端傳送模型引數，每個客戶端在本地訓練然後返回梯度，伺服器聚合這些梯度更新模型引數。

DP-PrivRec

我們在PrivRec的基礎上主要通過兩個額外的步驟來構建DP-PrivRec。
在客戶端本地更新的時候，我們需要對上傳的梯度進行一個裁剪，S是一個預定義的閾值。

在伺服器端聚合伺服器傳來的梯度時，我們需要加入噪聲，本文采用從高斯分佈\(N(0,\sigma ^2)\)

獲取噪聲，其中。
DP-PrivRec流程如下

實驗結果

作者在movielens和Frappe兩個資料集上做了實驗，本文提出的方法優於所有文中提到的聯邦推薦基線方法。NCF是一種效果很好的集中訓練的推薦模型，可以認為是本次實驗中的上界，PrivRec-GEN是PrivRec的集中訓練版本。

總結

本文重點在於使用隱私差分解決惡意參與者問題和使用一階元學習解決資料異構問題。因為隱私保護和模型效能是不能兼得的，使用差分隱私技術後模型效能會有一定的下降，本文提出的兩階段學習可以一定程度上緩解這個問題。本文使用的推薦模型是2013年提出的模型，如果換用更先進的模型，我認為效能還會有更大提升。

Fast-adapting and Privacy-preserving Federated Recommender System閱讀筆記

動機本文是2021年VLDBJ上的一篇論文。在聯邦推薦系統中，存在著資料異質性的問題，一些使用者與物品有很多互動，而一些使用者與物品互動很少，傳統的聯邦推薦利於活躍使用者的推薦，而幾乎忽略那些不活躍的使用者(這

Federated Collaborative Filtering for Privacy-Preserving Personalized Recommendation System閱讀筆記

動機本文是2019年華為釋出的一篇論文，是首個基於聯邦學習正規化的推薦框架。傳統的推薦系統需要把使用者資料上傳到伺服器然後集中訓練模型，但是隨著使用者的保護隱私意識逐漸加強和與隱私有關的法律頒佈，使用者可

Privacy Security in Big Data and Privacy-Preserving Data Mining (PPDM)

Introduction Big data is such a hot and well-known concept in recent years that it can often be heard or seen in everyday life. In this introduction, I would first explain the definition of big data

Learning local feature descriptors with triplets and shallow convolutional neural networks 論文閱讀筆記

Learning local feature descriptors with triplets and shallow convolutional neural networks 題目翻譯：學習 local feature descriptors使用 triplets 還有淺的卷積神經網路。讀罷此文，只覺收穫滿滿，同時另

MixGCF: An Improved Training Method for Graph Neural Network-based Recommender Systems閱讀筆記

動機本文是來自2021年KDD上的一篇文章。圖神經網路最近已經成為最先進的協同過濾解決方案，目前協同過濾中的一個挑戰是從隱反饋資料中提取負反饋訊號，但是目前很少有對基於GNN的協同過濾方法的負反饋取樣的研究。

Meta Matrix Factorization for Federated Rating Predictions閱讀筆記

動機本文是2020年SIGIR上的一篇論文。之前的大多數研究聯邦推薦系統的工作忽略了移動裝置的儲存、計算能力、通訊頻寬等方面的限制，本文針對這個問題，提出了MetaMF，它通過為每個移動裝置生成物品私有嵌入向量和預

論文閱讀：Privacy-Preserving Deep Learning

Privacy-Preserving Deep Learning 文章連結：http://www.cs.cornell.edu/~shmat/shmat_ccs15.pdf 發表於CCS2015

os方向論文推薦：NrOS: Effective Replication and Sharing in an Operating System

關於論文NrOS: Effective Replication and Sharingin an Operating System的閱讀筆記 NrOS: Effective Replication and Sharing in an Operating System

FAIR: Quality-Aware Federated Learning with Precise User Incentive and Model Aggregation閱讀筆記

動機本文是2021年infocom上的一篇論文。聯邦學習面臨著兩大挑戰:1.使用者可能並不願意參與到學習中，因為該學習消耗計算資源和精力。2.每個使用者提供的更新質量不同，低質量的模型更新會破壞整體模型的效能。針對以

EAST: An Efﬁcient and Accurate Scene Text Detector 論文閱讀

EAST: An Efﬁcient and Accurate Scene Text Detector 論文閱讀 Reference正文摘要引言相關工作方法演算法網路設計標籤生成損失函式訓練位置感知的NMS

閱讀筆記 Modality-specific and shared generative adversarial network for cross-modal retrieval

這一篇論文講的是使用多模態來進行圖片的檢索，通過文字檢索出最好的圖片，模型結構如下：

論文：Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks 閱讀筆記

一、論文 (16)Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks https://arxiv.org/abs/1604.02878

Fast RCNN論文閱讀筆記

1.Introduction 1.1 RCNN 和SPPnet RCNN有幾個顯著的問題：1.訓練的時候是多階段的訓練，分別分三個階段訓練卷積層、SVM、邊框迴歸矩陣。2.訓練很耗時。3.目標定位非常慢。它慢主要是因為它沒有共享計算，而

論文閱讀筆記《Deep Active Learning for Civil Infrastructure Defect Detection and Classification》

小樣本學習&元學習經典論文整理||持續更新核心思想本文提出一種基於主動學習的民用設施缺陷檢測方法，其思路主要是考慮到在樣本較少的情況下，訓練得到的網路可能不能很好的對各種型別的缺陷都進

Input and Output, Python Tutorial閱讀筆記（4）

　　參考資料：　　Python官網Tutorial 　　注：由於感覺自己的Python還沒有學通透，在看專案的程式碼時還是有一些困難。所以想看一下Python官網的Tutorial自學一下，我在讀的時候也是略過了自己已經會的地方，所以

閱讀筆記《A hybrid video anomaly detection framework via memory-argumented flow reconstruction and flow-guided frame prediction》

1. 摘要在本文中，提出了HF2VAD框架，一個集成了光流重建和框架預測的混合框架來處理視訊異常檢測。首先，設計了ML-MemAE-SC(具有跳過連線的自動編碼機中的多層次記憶模組)來記憶光流重建的正常模式，以便在光流重

LightGCN: Simplifying and Powering Graph Convolution Network for Recommendation閱讀筆記

動機本文是2020年SIGIR的一篇文章。最近圖卷積網路（GCN）在協同過濾推薦中大放異彩，但是卻很少有工作探究其為什麼在協同過濾推薦系統中有效，缺乏較為完善的消融實驗，在本文中，作者通過一系列消融實驗發現GCN中

1.4 Multiplication and Inverse Matrices 閱讀筆記

reference的內容為唯一教程，接下來的內容僅為本人的課後感悟，對他人或無法起到任何指導作用。

1.10 Independence, Basis and Dimension 閱讀筆記

reference的內容為唯一教程，接下來的內容僅為本人的課後感悟，對他人或無法起到任何指導作用。

A Survey on Accuracy-oriented Neural Recommendation From Collaborative Filtering to Content and Context Enriched Recommendation閱讀筆記

簡介本文是2022年TKDE上的一篇論文。本文以推薦模型的準確性為目標，系統地介紹了神經推薦模型，是一篇綜述性論文，閱讀本論文的目的是對推薦系統有一個比較系統的瞭解，確定目前自己學習的方向，同時尋找未來有哪些

Fast-adapting and Privacy-preserving Federated Recommender System閱讀筆記

動機

演算法

自監督學習獲取物品表示

PrivRec

DP-PrivRec

推薦模型

實驗結果

總結

相關推薦