文獻閱讀 BPR: Bayesian Personalized Ranking from Implicit Feedback
阿新 • • 發佈:2018-12-17
論文介紹
這篇論文被UAI 2009收錄,這篇論文在推薦系統領域中非常經典,就算十年後的今天仍然能在不少論文中看到BPR的身影。
簡介和相關工作
推薦系統的任務是給使用者推薦一系列個性化的物品,之前人們從顯式反饋中做推薦的主要方法為矩陣分解(MF)和適應性K最近鄰(KNN)。但是這些方法都不是對物品排名做直接的優化。於是這篇文章提出了一種個性化排名的方法BPR-OPT,這種方法是基於貝葉斯理論的極大化後驗概率。使用者的顯式反饋一般從使用者與系統的互動行為中得出,比如使用者的購買歷史,觀看歷史等,這些很容易從後臺日誌中得到。
論文核心
U:表示使用者集合
I:表示專案集合
那麼
表示所有的顯式反饋,如圖所示:
本文定義了一種偏序關係>u,並且這種偏序關係具有三種特徵:完整性,反對稱性,傳遞性。這樣可以根據上圖的使用者物品顯性反饋矩陣,得到所有使用者的偏序矩陣。如下圖所示:
其中,?表示無顯性打分資料,+表示使用者比j偏愛i,-則相反。
如果使用者對查看了物品i2,但是沒有檢視專案i1,那麼可以確定使用者對於i1,更偏愛i2。但是如果使用者同時查看了i1和i2或者同時都沒有檢視,那麼就是無法確定是否i1和i2的偏序關係。該篇論文的訓練集為Ds:
Ds是一個三元組(u,x,j)的集合。下面我們看看BPR-Optimization Criterion的推導公式:
表示使用者矩陣或者物品矩陣向量
此處是指示函式,當b為真的時候取1否則取0。
此處的啟用函式為sigmoid
BPR-OPT的推導過程如下: