深度學習在58同城智慧推薦系統中的應用實踐
阿新 • • 發佈:2019-01-28
在我們的部分推薦場景中帖子圖片比較大,例如優質高清的房源大圖對使用者會有較強的吸引,因此我們考慮將影象特徵引入到排序模型當中,例如將帖子影象轉化成一個特徵向量輸入到排序模型。騰訊2015年在IJCIA上發表的文章《Image Feature Learning for Cold StartProblem in Display Advertising》中就提出了該思路,它首先利用CNN 對影象進行特徵抽取得到特徵向量,然後輸入到LR 等常見模型。針對深度影象特徵的應用,阿里廣告團隊在2016年9月於Multimedia會議上發表的文章《Deep CTR Prediction in Display Advertising 》中提出了全新的端到端的思路(DeepCTR模型),模型結構是一部分利用CNN抽取出影象特徵,一部分使用一個全連線層對連續和離散特徵做embedding,兩者拼接在一起輸入神經網路進行訓練。但在我們的場景下,每天有數百萬的發帖,樣本中圖片數量大,DeepCTR模型離線訓練受CNN限制會很緩慢,並且線上預測時CNN部分也有較大的效能壓力。因此我們轉變了一下思路,嘗試了下圖所示的CNN+DNN模型,在這個模型中,我們使用CNN影象分類模型來做預訓練,生成了每張圖片的特徵向量,然後將影象特徵、離散特徵、連續特徵一起輸入至Wide&Deep中的Deep模型。在我們的場景下,該模型離線AUC相比 base模型有0.01的提升。