1. 程式人生 > >論文閱讀——YouTube的視訊推薦系統

論文閱讀——YouTube的視訊推薦系統

《The YouTube video recommendation system》是一篇詳細介紹YouTube視訊推薦的論文,在整個系統中沒有複雜的演算法,使用了一些簡單有效的策略,這也符合工業界的應用,在工業界,為了考慮演算法複雜度,資料量,可維護性等等一些因素,在工業界中,通常會選擇一些簡單有效的方法。

以下是論文的核心內容:

目標

幫助使用者找到高質量且符合使用者興趣的視訊,最終實現的是Top-N推薦。

總的思想

利用使用者的互動行為資料,推薦與互動過視訊相似的視訊。

相似視訊的挖掘

1、概念

相似視訊指的是:當給定視訊vi後,使用者更有可能觀看的視訊組成的集合

Ri,公式如下所示:

Ri=f(vi)

其中:

  • vi:種子視訊
  • Ri:與視訊vi相似的視訊的集合

2、方法

關聯規則(Association Rule)

計算與給定的種子視訊一起被觀看的概率,概率越大,相似性越高。

3、相似性的計算

計算的方法:

r(vi,vj)=cijf(vi,vj)

其中,f(vi,vj)稱為正則化函式,通常可以取為:f(vi,vj)=vivj

計算出所有的與視訊vi相似的視訊,根據相似性的值

r(vi,vj)從候選集Ri中找到Top-N的相似視訊。

(vi,vj)可以表示成一個有向圖,其中,權重為r(vi,vj),如下所示:

這裡寫圖片描述

生成推薦的候選

1、一級

假設種子集合為S,由上述的相似性的方法挖掘出一些候選:

C1(S)=viSRi

這裡寫圖片描述

這樣的方法容易產生narrow recommendations,即推薦的視訊與種子視訊相似度極高,這對推薦來說不能滿足多樣性的要求。

2、二級

以一級產生的候選C1作為種子,產生C2

C2(S)=vi
Cn1Ri

這裡寫圖片描述

3、多級

上述的結論推廣至多級,形成最終的推薦結果為:

Cfinal=(i=0NCi)S

Ranking

ranking的指標主要有:

  • 視訊質量
  • 使用者特性

其他

  • 評價的方法:線上A/B Test
  • 評價的指標:CTR

參考文獻

  • Davidson J, Liebald B, Liu J, et al. The YouTube video recommendation system[C]//Proceedings of the fourth ACM conference on Recommender systems. ACM, 2010: 293-296.