深度學習在推薦領域的應用lookalike
lookalike系統是幫助廣告投放商利用種子使用者找到相似的使用者,實現更精準的營銷觸達的系統。常見的looklike可以分為顯性定位和隱性定位,
1.顯性定位,根據使用者標籤直接定位,包括使用者基本資訊、興趣等,需要實現對使用者標籤資訊的挖掘
2.隱性定位,利用演算法進行定位 • 技術:機器學習
當2012年Facebook在廣告領域開始應用定製化受眾(Facebook Custom Audiences)功能後,“受眾發現”這個概念真正得到大規模應用,什麼叫“受眾發現”?如果你的企業已經積累了一定的客戶,無論這些客戶是否關注你或者是否跟你在Facebook上有互動,都能通過Facebook的廣告系統觸達到。“受眾發現”實現了什麼功能?在沒有這個系統之前,廣告投放一般情況都是用標籤去區分使用者,再去給這部分使用者傳送廣告,“受眾發現”讓你不用選擇這些標籤,。你需要做的只是上傳一批你目前已有的使用者或者你感興趣的一批使用者,剩下的工作就等著Custom Audiences幫你完成了。
Facebook這種通過一群已有的使用者發現並擴展出其他使用者的推薦演算法就叫Lookalike,當然Facebook的演算法細節筆者並不清楚,各個公司實現Lookalike也各有不同。這裡也包括騰訊在微信端的廣告推薦上的應用、Google在YouTube上推薦感興趣視訊等。下面讓我們結合前人的工作,實現自己的Lookalike演算法,並嘗試著在新浪微博上應用這一演算法。
問題場景:
廣告主使提供用種子使用者,通過lookalike系統獲取潛在客戶 Google similar audiences • Facebook lookalike audiences
常用的lookalike系統:
轉化為機器學習的模型 • 正樣本:廣告主提供的客戶名單(稱為種子使用者) • 負樣本:從活躍使用者(非種子使用者)隨機抽樣 • 打分結果:利用model對活躍使用者進行打分排序,取出目標數量
社交關係鏈的兩個核心價值 • 社交同質性:同質性是社交網路結構性的基本外 部原因 – 物以類聚人以群分 對於朋友圈廣告,種子使用者喜歡某廣告產品,那麼他的好友也有可能喜歡 • 社交影響力:指社交個體的思想、態度、情緒、 習慣乃至價值觀會受到其所在社群的其他人的影 響
因此對於社交網路的lookalike而言,擴散種子使用者的好友作為潛在使用者,因此便引出了一個問題,好友如何排序?好友相似度排序
共同好友多?同學?同事? • 溝通親密的? • 同齡的?同地域的?,除了定義人工規則之外,我們如何用機器學習來量化社交相似度
學習樣本:歷史廣告資料(稀疏,已知少部分的好友關 系) • 特徵資料: • 好友關係網路 • 溝通互動網路 • 文章轉發閱讀網路 • 公眾號關注 • …… • 機器學習: • 迴歸演算法,找出社交資料和廣告行為的函式關係