論文閱讀——YouTube的視訊推薦系統
阿新 • • 發佈:2019-01-26
《The YouTube video recommendation system》是一篇詳細介紹YouTube視訊推薦的論文,在整個系統中沒有複雜的演算法,使用了一些簡單有效的策略,這也符合工業界的應用,在工業界,為了考慮演算法複雜度,資料量,可維護性等等一些因素,在工業界中,通常會選擇一些簡單有效的方法。
以下是論文的核心內容:
目標
幫助使用者找到高質量且符合使用者興趣的視訊,最終實現的是Top-N推薦。
總的思想
利用使用者的互動行為資料,推薦與互動過視訊相似的視訊。
相似視訊的挖掘
1、概念
相似視訊指的是:當給定視訊後,使用者更有可能觀看的視訊組成的集合 ,公式如下所示:
其中:
- :種子視訊
- :與視訊相似的視訊的集合
2、方法
關聯規則(Association Rule)
計算與給定的種子視訊一起被觀看的概率,概率越大,相似性越高。
3、相似性的計算
計算的方法:
其中,稱為正則化函式,通常可以取為:。
計算出所有的與視訊相似的視訊,根據相似性的值從候選集中找到Top-N的相似視訊。
由可以表示成一個有向圖,其中,權重為,如下所示:
生成推薦的候選
1、一級
假設種子集合為,由上述的相似性的方法挖掘出一些候選:
這樣的方法容易產生narrow recommendations,即推薦的視訊與種子視訊相似度極高,這對推薦來說不能滿足多樣性的要求。
2、二級
以一級產生的候選作為種子,產生。
3、多級
上述的結論推廣至多級,形成最終的推薦結果為:
Ranking
ranking的指標主要有:
- 視訊質量
- 使用者特性
其他
- 評價的方法:線上A/B Test
- 評價的指標:CTR
參考文獻
- Davidson J, Liebald B, Liu J, et al. The YouTube video recommendation system[C]//Proceedings of the fourth ACM conference on Recommender systems. ACM, 2010: 293-296.