1. 程式人生 > >1、好的推薦系統

1、好的推薦系統

一:推薦系統的目的:

要發掘長尾提高銷售額,就必須充分研究使用者的興趣,而這正是個性化推薦主要解決的問題。推薦系統通過發掘使用者的行為,找到使用者的個性化需求,從而將長尾商品準確地推薦給需要它的使用者,幫助使用者發現那些他們感興趣但是又很難發現的商品

二:推薦系統的應用:

個性化推薦系統需要依賴使用者的行為資料,總體來說,幾乎所有的推薦系統應用都是由前臺的展示頁面,後臺的日誌系統以及推薦演算法三部分構成。
亞馬遜:

  1. 推薦結果的標題,縮圖,以及其它屬性:告訴使用者給他們推薦的是什麼。
  2. 推薦結果的平均分:反應了推薦結果的質量
  3. 推薦理由:新增使用者自選按鈕,可以關閉推薦
  4. 個性化推薦:新增哪個好友喜歡的物品

2.1 個性化應用背景:

  1. 存在資訊過載,因為如果使用者可以很容易地從所有物品中找到喜歡的物品,就不需要個性化推薦了
  2. 使用者大部分時候沒有特別明確的的需求,因為如果使用者有明確的需求,可以直接通過搜尋引擎找到感興趣的商品。

2.2 個性化應用形式:

  • 電商平臺
  • 電影視訊網站
  • 社交網路
  • 個性化閱讀
  • 基於位置的服務

2.3推薦系統評測:

好的推薦系統不僅僅能夠準確預測使用者的行為,而且能夠擴充套件使用者的視野,幫助使用者發現那些他們可能會感興趣,但卻不那麼容易發現的東西。同時,推薦系統還要能夠幫助商家將那些被埋沒在長尾中的好商品介紹給他們感興趣的商戶。

2.4推薦系統實驗方法:

一般來說,一個推薦演算法最終上線,需要完成上面所說的三個實驗。
1. 需要通過離線實驗證明它在很多離線指標上優於現有的演算法
2. 需要通過使用者調查確定它的使用者滿意度不低於現有的演算法
3. 通過線上的AB測試確定它在我們關心的指標上優於現有的演算法
評測指標:

2.4.1:使用者滿意度:

使用者滿意度沒有辦法離線計算,只能通過使用者調查或者線上實驗獲得。

在線上系統中,我們可以利用購買率度量使用者的滿意度。此外,有些網站會通過設計一些使用者反饋介面收集使用者滿意度。
更一般的情況下,我們通過統計反饋訊息以及點選率使用者停留時間

轉化率來度量使用者滿意度。
a、評分預測:使用者給物品打分的功能,那麼,如果知道了使用者對物品的歷史評分,就可以從學習的使用者的興趣模型,並預測該使用者在將來看到一個他沒有評過分的物品時,會給這個物品評多少分。
這裡寫圖片描述
b、topN推薦:網站在提供推薦服務是,一般是給使用者一個個性化的推薦列表,這種推薦叫做 TopN推薦。TopN推薦的預測準確率一般通過準確率(precision)/召回率(recall)度量

這裡寫圖片描述

2.4.2 覆蓋率:

覆蓋率描述了一個推薦系統對物品長尾的發掘能力,覆蓋率有不同的定義方法。一個好的推薦系統不僅需要有比較高的使用者滿意度,也要有比較高的覆蓋率。
我們可以通過研究物品在推薦列表中出現的次數的分佈描述推薦系統挖掘長尾的能力,如果這個分佈比較平,那麼說明推薦系統的覆蓋率較高,而如果這個分佈比較陡峭,說明推薦系統覆蓋率較低。我們有兩個比較好的指標來定義覆蓋率
1.資訊熵
這裡寫圖片描述
2.基尼係數
這裡寫圖片描述
這裡寫圖片描述

2.4.3 多樣性

為了滿足使用者廣泛的興趣,推薦列表需要能夠覆蓋使用者不同的興趣領域,即推薦結果需要具有多樣性,儘管使用者的興趣
這裡寫圖片描述
這裡寫圖片描述

2.4.4 新穎性

新穎的推薦是指給使用者推薦那些他們以前沒有聽說過的物品,在一個網站中實現新穎性的最簡單方法是,把那些使用者之前在網站中對其有過行為的物品從推薦列表中過濾掉

2.4.5 驚喜度

令使用者驚喜的推薦結果是和使用者歷史喜歡的物品不相似,但使用者卻覺得滿意的推薦。

2.4.6 信任度

1、讓使用者瞭解推薦系統的推薦機制,讓使用者認同推薦系統的執行機制
2、利用好友資訊給使用者做推薦,並且用好友進行推薦解釋。

2.4.7 實時性

1、推薦系統需要實時地更新推薦列表來滿足使用者新的行為變化
2、需要將新加入系統的物品推薦給使用者

2.4.8 健壯性

1、設計推薦系統時儘量使用代價比較高的使用者行為。比如,如果使用者有購買行為和瀏覽行為,那麼主要應該使用使用者的購買行為,因為購買需要消費,所以攻擊購買行為的代價遠遠大於瀏覽行為
2、在使用資料前,進行攻擊檢測,從而對資料進行清理