ACM recsys十年回顧(轉載)
ACM(國際計算機學會)主辦的推薦系統專場(Recsys)是推薦系統圈子的頂級會議,從 2007 年開始,至今已經十年,這十年中每年都有
Tutorial 公佈,本文整理出來,可以一探推薦系統的業界和學界興趣點的遷移。
十年回顧
2007
本年度並沒有公開的 Tutorial,但從會議收錄的文章主題,可以看到本屆會議重點討論的話題是:隱私和信任,協同過濾
2008
- Robust Recommender Systems
作者:Robin Burke (DePaul University)
主題:關於推薦系統的健壯性,主要有:對推薦模型的攻擊種類,量化分析攻擊產生的影響,推薦演算法替代方案,留住使用者的信任,對攻擊方的檢測。
關鍵詞:健壯性,推薦系統安全
- Recent Progress in Collaborative Filtering
作者:Yehuda Koren (Bell Labs)
主題:以 Netflix Prize 比賽為主線,回顧了協同過濾相關演算法的前世今生。同時,強調推薦系統是一個多目標優化的系統,所以也對多種效果評價指標做了對比。
關鍵詞:協同過濾,多目標優化,效果評價
- Context-Aware Recommender Systems
作者:Gedas Adomavicius (University of Minnesota) and Alex Tuzhilin (NYU)
主題:傳統推薦系統致力於給使用者找出相關的物品,但是僅僅是這樣已經不夠了,現在(注意這時候是 2008 年)需要根據當時所在時間和位置給出更合適宜的推薦,比如旅行推薦。這就是所謂考慮上下文資訊或者說場景的推薦系統。
關鍵詞:場景資訊
2009
- Important Research Challenges in Recommenders
作者:John Riedl (University of Minnesota), John Sanders (Netflix) and Todd Beaupre (Yahoo!)
主題:回顧了個人在從事推薦系統研究過程中所遇到的挑戰:透明度,EE 問題,防沉迷,興趣遷移,長短期興趣融合,讀懂使用者行為的含義,效果評價。
關鍵詞:透明度,EE 問題,效果評價。
- Bayesian Modeling for Recommender Systems
作者:Asim Ansari (Columbia University)
主題:關於在推薦系統建模中的貝葉斯身影。
關鍵詞:貝葉斯
- Using Social Trust for Recommender Systems
作者:Jennifer Golbeck (University of Maryland)
主題:在推薦系統中引入社交關係以增強推薦結果的信任度,從而提升推薦系統的效果。
關鍵詞:社交推薦,信任度
2010
- Evaluating Recommender Systems
作者:Guy Shani
主題:關於如何評價推薦系統的問題,分為線上和離線兩部分。分別詳細降到了離線階段如何模擬使用者行為做一個實驗,在現階段如何做一個實驗,並討論了使用者研究、使用者體驗等泛技術領域話題。
關鍵詞:效果評價
- HCI for Recommender Systems: An Introduction
作者:Joseph A. Konstan
主題:介紹人機互動概念、技術,討論推薦系統中關於互動設計的影響。
關鍵詞:人機互動
- Query Intent Prediction and Recommendation
作者:Ricardo Baeza-Yates
主題:查詢意圖是搜尋引擎的技術範疇,但使用者明確提交一個查詢本身就反映了非常明確的使用者需求和興趣,所以本人就探討了查詢意圖識別在推薦系統中的應用。同時,還在搜尋中嘗試了相關搜尋推薦。
關鍵詞:查詢意圖,搜尋引擎
2011
- Music Recommendation and Discovery Revisited
作者: Òscar Celma (BMAT) and Paul Lamere (The Echo Nest)
主題:回顧總結了線上音樂應用的推薦系統原理,挑戰,以及那些可能用於在未來(站在 2011 年)提升音樂推薦系統效果的技術。
關鍵詞:音樂推薦
- Robustness of Recommender Systems
作者:Neil Hurley (UCD)
主題:討論推薦系統的攻擊,列舉了近十年來(站在 2011 年)真實發生的推薦系統攻擊案例,總結其中的特點,為了更好的加強推薦系統的健壯性。
關鍵詞:健壯性,推薦系統安全
- Recommendations as a Conversation with the User
作者:Daniel Tunkelang (LinkedIn)
主題:把推薦系統看成是使用者和資訊獲取平臺之間的對話通道,會是什麼樣的情形?
關鍵詞:人機互動,對話系統
2012
- Conducting User Experiments in Recommender Systems
作者:Bart Knijnenburg (UC Irvine)
主題:我們一直以來就是聚焦於離線階段用量化的指標去評價推薦系統的演算法效果,但是如何去評價使用者體驗呢?使用者體驗是主觀的,畢竟我們無法知道每個人內心的感受。本文主要討論推薦系統中如何考慮使用者體驗。
關鍵詞:使用者體驗,效果評價
- Personality-based Recommender Systems: An Overview
作者: Maria Augusta S. N. Nunes (UF Sergipe) Rong Hu (EPFL)
主題:介紹了人這種非理性動物在做決策時的個性因素,及其對推薦系統的啟發,把“個性化”和“推薦系統”放在一起考量,同時介紹了實現個性化的推薦系統需要哪些關鍵技術,以及會遇到哪些挑戰。
關鍵詞:個性化
- Building Industrial-scale Real-world Recommender Systems
作者:Xavier Amatriain (Netflix)
主題:這是當時的 Netflix 演算法總監(現在已經是 Quora 主管工程的副總裁)總結的工業級推薦系統經驗。推薦系統每年的論文層出不窮,但如何才能在自己的商業系統中將其落地,是很多人關心的頭等大事,對此本文總結了若干要點。可擴充套件性,低延遲等工業級系統的要求要考慮,模型方面,除了準確性,還有新鮮度,新奇度,透明度也是工業級推薦系統要考慮的。以 Netflix 的生產系統為例將這些問題做了逐一梳理。
關鍵詞:工業級
- Best Practices Tutorial and Panel Discussion: The Challenge of Recommender Systems Challenges
作者:Alan Said (TU Berlin), Domonkos Tikk (Gravity) and Andreas Hotho (U Wurzburg)
主題:近年來組織的推薦系統相關比賽很多,以 Netflix Prize, KDD Cup 為典型代表,這些比賽為推薦系統領域貢獻了很多優秀的開發經驗,那麼到底贏得一場這樣的比賽有哪些關鍵點要做好呢?本文就此討論了一番。
關鍵詞:推薦系統比賽,最佳實踐
2013
- Invited Tutorial: Mining Social Networks for Recommendation
作者: Martin Ester (Simon Fraser University, Canada)
主題:社交資訊可以為推薦系統帶來貢獻,這幾乎是共識,但到底帶來什麼貢獻?怎麼帶來貢獻?為冷啟動問題貢獻使用者個人資訊,是一個典型的應用。社交網路上的好友推薦也是個典型應用。未來有哪些方向可以嘗試或者挑戰?把社交網路看成一個分散式網路,P2P 網路,以及如何保護隱私的問題。
關鍵詞:社交網路
- Learning to Rank
作者: Alexandros Karatzoglou (Telefonica Research, Spain), Linas Baltrunas (Telefonica Research, Spain) & Yue Shi (Delft University of Technology, Netherlands)
主題: 本文討論排序模型在推薦系統的應用,現有模型的優劣區別,未來的可能發展方向。
關鍵詞:LTR,排序模型
- Beyond Friendship: The Art, Science and Applications of Recommending People to People in Social Networks
作者:Luiz Augusto Pizzato (University of Sydney, Australia) & Anmol Bhasin (LinkedIn, USA)
主題:關於社交網路推薦系統,不只是建立社交關係那麼簡單。本文深入討論了這個問題,首先描述了經典方法如連結分析和協同過濾方法,接著深入討論了諸如相互作用,基於使用者之間的社交圖譜的好友推薦,內容來自作者在 LinkedIn 的第一線工作內容。
關鍵詞:社交網路
- Preference Handling
作者: Alexis Tsoukiàs (Université Paris Dauphine, France) & Paolo Viappiani (Université Pierre et Marie Curie, France)
主題:關於使用者偏好研究。使用者偏好不止是推薦系統的研究物件,它是很多其他領域的關注點:博弈論,決策論等。文中還討論了在推薦系統中,使用者偏好如何學習和融合。
關鍵詞:使用者偏好
2014
- The Recommender Problem Revisited
作者:Xavier Amatriain (Netflix Inc., USA)
主題:本文回顧了 Netflix Prize 比賽用均方根誤差簡化了推薦系統的問題,實際上一個現代的商業推薦系統中,還要考慮:個性化排序,相似度,推薦解釋,場景資訊(上下文資訊),和搜尋引擎的結合。還回顧了一些重要的推薦模型,Factorization Machines, Restricted Boltzmann Machines, SimRank, Deep Neural Networks, Listwise Learning-to-rank。
關鍵詞:工業級,場景資訊
- Personalized Location Recommendation on Location-based Social Networks
作者:Huiji Gao, Jiliang Tang, and Huan Liu (Arizona State University, USA)
主題:移動網際網路的崛起,推薦系統可以接入的資料更多,應對的場景更豐富,上傳地理位置,隨時隨地在社交網路上分享內容,這些都可以引入到社交推薦中了。本文從資料探勘的角度去介紹當這些資料引入後有哪些新的嘗試。
關鍵詞:社交網路,地理位置
- Cross-Domain Recommender Systems
作者:Ivan Cantador (Universidad Autónoma de Madrid, Spain) and Paolo Cremonesi (Politecnico di Milano, Italy)
主題:社交電商中,使用者提供的資訊是跨領域的。使用者在不同系統中產生的反饋,填寫的資料可以互相交叉使用,尤其是:解決冷啟動問題得到更好的推薦效果,解決資料稀疏問題得到更好的使用者模型。本文針對跨領域的推薦系統,分別從使用者建模、推薦系統、機器學習等角度討論了這一問題。
關鍵詞:跨領域,冷啟動
- Social Recommender Systems
作者:Ido Guy (Yahoo! Labs) and Werner Geyer (IBM Research)
主題:本文是全面梳理社交網路推薦系統的一篇綜述性 Tutorial。
關鍵詞:社交網路
2015
- Replicable Evaluation of Recommender Systems
作者:Alan Said (Recorded Future, Sweden) and Alejandro Bellogín (Universidad Autónoma de Madrid, Spain)
主題:推薦系統的效果評價一直是受多種因素影響的,尤其是對比兩個推薦模型更不是那麼容易。本文為你展示了一種非常清晰明瞭的方式來評價推薦系統結果,這個方式的特點是:可比較、可復現、無偏。
關鍵詞:效果評價
- Real-time Recommendation of Streamed Data
作者:Frank Hopfgartner (University of Glasgow, UK), Benjamin Kille (TU Berlin, Germany), Tobias Heintz (plista GmbH, Germany) and Roberto Turrin (ContentWise, Italy)
主題:基於流式資料的實時推薦系統如何離線評價?如何做 AB 對照試驗?本文討論了這兩個問題。
關鍵詞:實時推薦,效果評價,ABtest
- Scalable Recommender Systems: Where Machine Learning Meets Search!
作者:Joaquin A. Delgado (Verizon, US) and Diana Hu (Verizon, US)
主題:典型的搜尋和推薦都有兩個階段,召回和排序。所以整合了機器學習的搜尋引擎也可以用於推薦系統,本文介紹了一個開源框架,ML-Score,一個深度整合 ElasticSearch 的外掛,用於替換 ES 預設的排序機制,而代之以機器學習排序,模型可以用 Spark Weka R 訓練得到。
關鍵詞:搜尋引擎,ElasticSearch
- Interactive Recommender Systems
作者:Harald Steck (Netflix Inc., US), Roelof van Zwol (Netflix Inc., US) and Chris Johnson (Spotify Inc., US)
主題:有一種推薦系統,介於主動搜尋和被動推送之間,就是互動式推薦系統,它的特點是使用者不斷對推送結果給予明確反饋,從而引導推薦系統朝自己希望的方向推薦結果。這是一個 EE 平衡的問題。本文針對音樂推薦(Spotify)和視訊推薦(Netflix),根據使用者研究和 AB 對照試驗結果,討論這種推薦系統的方方面面。
關鍵詞:Explore&Exploit 問題,互動式推薦
2016
- Lessons Learned from Building Real-Life Recommender Systems
作者:Xavier Amatriain (Quora, USA) and Deepak Agarwal (LinkedIn, USA)
主題:本文是 Quora 的工程副總裁根據自己在 Netflix 和 Quora 的實踐總結出來的十條經驗。
關鍵詞:工業級
- Matrix and Tensor Decomposition in Recommender Systems
作者:Panagiotis Symeonidis (Aristotle University, Greece)
主題:推薦系統中有很多矩陣分解方法,本文用一個統一的例子帶你逐一分析這些矩陣分解方法。
關鍵詞:降維,矩陣分解
- People Recommendation
作者:Ido Guy (Yahoo Research, Israel) and Luiz Pizzato (Commonwealth Bank of Australia, Australia)
主題:本文介紹了社交網路中最常見的推薦系統“可能感興趣的人”“你可能想關注”。
關鍵詞:社交網路
- Group Recommender Systems
作者:Ludovico Boratto (University of Cagliari, Italy)
主題:通常推薦系統都是針對單個使用者的,那麼針對一個群體的推薦系統該怎麼做呢?有哪些不同?該如何評價?本文討論的就是針對群體的推薦系統。
關鍵詞:群推薦
2017
- Privacy for Recommender Systems
作者:Bart Knijnenburg (Clemson University, USA) and Shlomo Berkovsky (CSIRO, Australia)
主題:推薦系統對資料是貪婪的,但是使用者隱私保護也很重要。如何保護隱私,本文從架構、演算法、策略相關、UI 設計等角度探討了這一話題。
關鍵詞:使用者隱私
- New Paths in Music Recommender Systems Research
作者: Markus Schedl (Johannes Kepler University Linz, Austria), Peter Knees (Vienna University of Technology, Austria) and Fabien Gouyon (Pandora Inc., USA)
主題:音樂推薦早已經不再是簡單的內容推薦或者協同推薦能滿足得了聽眾的了,如今線上音樂推薦的是一種收聽體驗。簡單說就是一種序列推薦,情境推薦,而不簡單是某一首歌推薦得“精準”。本文介紹了學術界和工業界對現在音樂推薦提出的解決方案,主要包括:播單生成,情境推薦,音樂製作時的推薦。
關鍵詞:音樂推薦,工業級
- Deep Learning for Recommender Systems
作者:Alexandros Karatzoglou (Telefonica Research, Spain) and Balázs Hidasi (Gravity R&D, Hungary)
主題:本文介紹了深度學習在推薦系統的應用,如 RNN,CNN;使用了深度學習的基於內容推薦和協同推薦是什麼樣的。
關鍵詞:深度學習
- Product Recommendations Enhanced with Reviews
作者:Muthusamy Chelliah (Flipkart, India) and Sudeshna Sarkar (IIT Kharagpur, India)
主題:電商中使用者評價用於推薦系統非常常見,本文介紹了電商推薦系統中對使用者評價的使用,涉及到文字挖掘,情感分析,話題模型,詞向量學習。
關鍵詞:NLP
- Open Source Tools for Online Learning Recommenders
作者: Róbert Pálovics (Hungarian Academy of Sciences, Hungary), Domokos Kelen (Hungarian Academy of Sciences, Hungary) and András A. Benczúr (Hungarian Academy of Sciences, Hungary)
主題:如今的推薦系統早已經不再是週期性計算出推薦結果後再呈現給使用者的時代了,線上學習,實時或者準實時捕捉使用者的反饋非常必要。但是相應的工程門檻也不低,本文手把手教你如何利用開源工具搭建線上學習系統用於實時推薦系統中。
關鍵詞:實時推薦
話題變遷分析
常規話題
歷時十年,有幾個話題是一直都存在的:
-
健壯性及推薦系統安全問題
-
從學術到工業級別的推薦系統的跨越問題
-
推薦系統的效果評估問題
-
如何使用更多的資料以及使用者隱私的權衡問題
-
使用者建模
產品應用
下面這些產品是 Resys 中最常聊到的推薦系統落地場景:
-
線上視訊
-
社交網路
-
線上音樂
-
電商網站
演算法和技術
在這十年裡,真正落地到工業界產生效果的演算法和技術基本上圍繞下面這些方向:
-
協同過濾
-
矩陣分解
-
深度學習
-
NLP
後記
ACM 的推薦系統專場這十年彙集了全球頂級的 Resyser,他們把各自在工作中研究中碰到的問題,得到的經驗毫無保留分享出來,非常值得尊敬和感謝。
但另一方面,我們要在自己的應用中落地實踐這些又不是那麼簡單,中間存在一定的鴻溝需要跨過,畢竟路要一步一步走出來。
希望大家能在自己的產品中“大吉大利,每天吃雞”。
轉載自 https://zhuanlan.zhihu.com/p/34083992?group_id=952098886127419392