1. 程式人生 > >【實習總結】百度小視訊策略--推薦演算法實習生

【實習總結】百度小視訊策略--推薦演算法實習生

終於結束了在百度的實習,想想真滴是累,天天11點才回到宿舍,出個問題整個週末就沒了。唉,不過也總歸是有些收穫。

這個部落格就稍微講講整個組推薦系統的框架吧(應該所有市面上的推薦系統都大致是這個樣子,不過裡面的具體策略就略過啦)

般推薦都分為召回側和排序側,召回側通過各種策略對視訊進行打分篩選,例如對於一個使用者和多個視訊而言,可以關注的點為:該使用者對視訊的興趣;視訊相似度、dnn計算得分、協同過濾、matchnet等等,這裡的每一個策略都要求是簡單並且時間複雜度低的,因為對於一個請求而言,在召回側需要處理所有待分發的視訊,故結構應該儘量簡單。

接下來是排序側,排序首先就需要經過粗排和精排兩個部分,粗排的邏輯是將召回返回的視訊打分,輸出給精排幾百條視訊;精排的邏輯是將粗排返回的視訊打分,返回10條視訊,這裡的10對應在app上每一刷出10個視訊。當然過了精排還不夠,例如雖然一個人非常喜歡美女,但不能刷一次推薦的10條視訊全是美女,所以每一個推薦系統都會加入多樣性的模組,保證每一刷推薦視訊的豐富度以及類別散度。過了多樣性後,最後一個模組是生態塊,這一塊主要是一些可持續發展的策略,比如要有新視訊提權、優質作者提權的策略。在多樣性和生態這兩塊主要做的就是一些視訊的替換,至此,我們這一塊要知道的推薦就完了,當然還有一些資料來源啊、日誌落盤等等,都存在於上述模組的上下游,我也不是特別瞭解。

那具體還有一些問題,比如粗排和精排的具體模型結構是什麼,為什麼既有粗排也有精排等等,這些問題就留給大家自己去考慮啦