聊聊淘寶天貓個性化推薦技術演進史
引言:個性化推薦技術直面用戶,可以說是站在最前線的那個。如今,從用戶打開手機淘寶客戶端(簡稱“手淘”)或是手機天貓客戶端(簡稱“貓客”)的那一刻起,個性化推薦技術就已經啟動,為你我帶來一場個性化的購物之旅。本文將細數個性化推薦的一路風雨,講講個性化推薦技術的演進史。
本文選自[《盡在雙11——阿裏巴巴技術演進與超越》。
1、個性化推薦All-in無線
無線個性化推薦起步於2013年10月。現在往回看,當時的阿裏很好地把握住了移動端快速發展的浪潮,以集團All-in無線的形式吹響了移動端戰鬥的號角。個性化推薦團隊也是從All-in無線這一事件中孵化的。我們從零開始搭建了個性化推薦算法體系及個性化算法平臺TPP。TPP這一個性化算法平臺對個性化推薦團隊的成長起到了至關重要的作用。基於TPP,個性化算法團隊成員們驗證算法的速度得到了極大的提高,優化算法的速度從而也得到了極大的提高。僅僅花了不到兩個月的時間,個性化推薦的第一版算法就在“有好貨” 中初露鋒芒:結合基於主動學習的選品算法平臺TSP,個性化推薦團隊一舉打造了“有好貨”針對高端人群的優質導購體驗。
正是在All-in無線後的這一年,個性化推薦開始在阿裏逐步成長起來。
2、 個性化推薦初逢雙11
2015年,個性化推薦第一次在雙11中大放異彩。還記得當年9月中旬,我們正在維也納參加推薦系統最大的會議RecSys。逍遙子突然來電,告知在2015年雙11上要全面開啟個性化推薦,隨行的同事們都很興奮,但我們又不得不面臨缺乏雙11實戰經驗的實際問題。當然,機會和風險往往是並存的。面對挑戰,我們很快開始規劃進程和分工。回到杭州之後,團隊全員進入備戰狀態,我們的努力在雙11當天得到了回報。2015年11月12日淩晨,推薦算法團隊、手淘及天貓的眾多小夥伴們並不覺得疲乏,大家的臉上都閃爍著喜悅。個性化推薦算法在雙11大放光芒,一個又一個令人瞠目的數字足以為證。個性化推薦的第一戰場“雙11主會場”更是自雙11開展多年以來首次達到了個位數的跳失率,其引導人數和人均引導頁面數都是前一年的2~3倍。不得不說,這些令人振奮的結果都要歸功於之前兩年中個性化推薦在無線端的落地。
樓層順序個性化使得女神看到的樓層順序可能是女裝、美妝、天貓國際等,歐巴看到的樓層順序可能是男裝、旅行、數碼等。
樓層內坑位內容個性化,使得在同一個樓層內,不同用戶看到的商品或店鋪不同,比如同樣都是美食控,喜歡辣味的用戶可能看見麻辣牛肉幹,喜歡甜味的用戶可能看見巧克力。
坑位內容素材個性化,使得同一個樓層的同一個坑位,即便算法預測兩個用戶都需要巧克力,但一個喜歡費列羅而另一個喜歡德芙,也會在入口圖上展示不同的品牌。 “天坑一號”個性化主會場示意圖
這三層個性化中涉及多策略推薦算法、排序學習、合圖等多項技術。整個項目的進展用六個字來總結就是“時間緊任務重”。在多個團隊的辛勤工作及緊密協作下,我們第一次全方位地將自All-in以來所積累的個性化推薦技術用於如此復雜的場景之中。
個性化推薦在“雙11主會場”取得成功的因素有很多。其中,最值得稱道的莫過於“首圖個性化”。在指甲殼大小的空間上,我們對產品創意素材和文字進行精雕細琢和個性化投放。這一改變極大地提升了用戶活躍度,並催生了2015年雙11主會場的個性化項目。該項目的成功上線成倍地降低了會場跳失率。更重要的是,個性化推薦為用戶帶來了全新的無線端購物體驗,並且為阿裏在電商領域的茁壯成長帶來了顯著的助力作用。個性化推薦算法團隊因此榮獲2015年CEO特別貢獻獎。下面引用阿裏巴巴CEO逍遙子嘉獎信裏的一段話:“這次雙11的一大亮點是,我們基於大數據的無線產品和技術的創新,使得整個運營效率有了大幅度提升。淘系的活躍用戶得到了充分的引導和互動,得到了大量個性化的展示和推薦,事實證明了大數據的巨大威力。我們用大數據賦能了雙11,賦能了我們自己的運營能力。”
正是在2015年雙11之後,個性化推薦的故事開始為人們津津樂道。
3、 個性化推薦再戰雙11
2015年雙11之後,個性化推薦團隊乘風起航,繼續發力。正是這一年的持續發展,使得個性化推薦在2016年雙11中更進一步,遍及無線端的各個場景。包括主會場在內的幾乎全部活動會場、產品都實現了個性化算法投放。個性化推薦團隊的代表作“海神”以及“魯班”(下圖為魯班批量生產的創意Banner)都是首次在雙11中亮相。
魯班批量生產的創意Banner
在2016年雙11中,面對更為復雜的個性化需求,樂田及工程師們將全面升級後的個性化推薦完美地展現在雙11主會場中。雖然2016年的雙11主會場與2015年的“天坑一號”主會場極其相似,但這一次個性化推薦產品做得更為精細了。其中,GBDT+FTRL、Wide & Deep Learning和AdaptiveLearning這三項最前沿的機器學習技術被應用到了主會場的三層結構中,極大地提升了在線模型的效果及實時預測的效率。
除了常規的個性化推薦之外,我們在2016年雙11開始嘗試融合商家流量分配的個性化推薦。逍遙子在2015年雙11總結中提到:“我們還要更上一層樓,利用大數據賦能給所有的商家,幫助他們運營好消費者,這樣才能讓我們在大數據時代踐行‘讓天下沒有難做的生意’的使命。”隨著個性化場景的不斷升級,商家很多時候都對流量的波動束手無策。對那些有運營能力的商家來說,我們希望其通過更多優質的商品和優秀的服務換來更多的流量或銷量上的部分確定性。因為推薦各場景大小不一、定位差異大,有導購類場景、有成交類場景等,我們需要根據場景本身的特性來進行流量智能調控。因此,商家賦能個性化推薦系統 — Matrix應運而生。Matrix系統主要用於調節用戶體驗、賣家流量訴求和投資回報率、電商平臺健康度等方面的效用,平衡場景的短期收益和長期收益。在2016年雙11中,Matrix在部分場景的上線為今後的賣家賦能積累了寶貴的經驗。
賦能商家的Matrix系統流程圖
4、 個性化推薦的智能未來
個性化推薦從無到有,直到演進成為CEO逍遙子口中的“電商基礎設施”,這一切來得極為不易。面對更具挑戰的未來,個性化推薦可以做得更好、更智能,而基於全局信息的個性化推薦將會是達成這一目標的重要途徑。
眾所周知,個性化推薦涉及多種不同層次、不同粒度的子任務。從推薦內容上來說,個性化推薦分為商品推薦、店鋪推薦、品牌推薦、評論推薦等;從推薦目標上來說,個性化推薦分為點擊率預測、轉化率預測、成交量預測等。雖然我們當前設計的個性化推薦算法在TPP上實現了流程一體化,但我們對每個推薦場景面臨的子問題卻是單獨建模的。如果能從全局的角度分析用戶的喜好,個性化推薦必然能夠更上一層樓。
2016年,我們已經通過深度強化學習(Deep Reinforcement Learning)技術對全局信息共享下基於多任務學習 (Multi-task Learning)的個性化推薦進行了初步探索。從數據流通鏈路來看(比如下圖所示的手淘場景數據流通圖),我們可以很自然地將全鏈路多場景的推薦任務理解為推薦系統面向用戶的連續決策過程。隨著用戶對不同推薦場景的持續瀏覽和交互,推薦系統對於用戶實時需求和意圖的理解會越來越清晰,因此也可以更準確地為用戶推薦更為合適的內容。深度強化學習已經在人工智能領域掀起了新的浪潮,這一技術必將成為個性化推薦智能化的最強武器。
手淘場景數據流通圖
5、 總結
個性化推薦所取得的成就是一個“意料之外卻情理之中”的結果。僅僅經歷了短短幾年的時間,淘寶和天貓就從以人工運營為主分配流量和資源位的方式成功轉變為以大數據和人工智能為導向的新方式。與此同時,我們初步建立了人工經驗與算法投放協同工作的機制。自2013年年底All-in無線以來的沈澱和積累終於逐步轉化成了果實。經過不斷地積累和打磨,個性化推薦技術變得越發成熟和犀利,相信個性化推薦的未來會更好。
本文選自《盡在雙11——阿裏巴巴技術演進與超越》,點此鏈接可在博文視點官網查看此書。
想及時獲得更多精彩文章,可在微信中搜索“博文視點”或者掃描下方二維碼並關註。
聊聊淘寶天貓個性化推薦技術演進史