1. 程式人生 > >8、Collaborative Metric Learning

8、Collaborative Metric Learning

一、摘要:

文章的核心思想:是如何把Metric learning 和 CF結合起來從而達到更好的推薦效果。

提出了CML(Collaborative Metric Learning),其學習一個聯合度量空間,不僅編碼使用者的偏好,而且編碼使用者-使用者和專案-專案的相似性。

假設使用者和物品可以放到低維空間,並且可以使用滿足不等式性質的歐式距離來度量他們之間的距離。

 

將ML和CF結合的原因是: 傳統的CF都使用了點積來衡量使用者向量和專案向量的距離。即點積值越大就代表兩個向量相近。但這篇文章認為點積計算距離可能使得相似度不準確。

一個距離測量需要滿足一些條件(如三角不等式

)。三角不等式關係:距離的大小是有傳遞的。比如:X與Y相近,X與Z相近,則Y與Z也相近。也就是說相似度是可以傳遞的,但是積極的評分,沒有評分的沒有顯示】

改進的MF:weighted regularized matrix factorization (WRMF)

case weight cij is larger for observed positive feedback and smaller for unobserved interactions。

(2)貝葉斯個性化排序BPR:

3、協同度量學習:(CML)

CML和LMNN的區別:CML將同類資料聚合去掉,只保留異類遠離部分,即保留Lpush。

【原因是一個物品可能被多個人喜歡,很難說清楚怎麼聚類比較有意義。具體說就是一個使用者所喜歡的物品要遠離這個使用者所不喜歡的物品,同時這個距離會被一個與rank(物品的排序)有關的權重所控制】

給定所有資料與一個數據集S,S是user-item的資料對,並且是已知具有正相關的,通過學習user-item 之間度量來將這種關係編碼到第三方空間。

(1)模型主要公式:LMNN【度量學習ML】

 

(2)WRMF【CF中的MF】

令J為全部專案的數量,N為否定專案的資料,rankd(i; j) 接近於[J / N ]。

 (3)整合專案特徵

f 表示 專案特徵vj 的投影函式,其在一定程度上是可以代表專案特徵的。 

(4)正則化

 

 (5)總的模型: