推薦系統入門——初步理解

阿新 • • 發佈：2019-01-07

一、什麼是推薦系統？

推薦系統是啥？

如果你是個多年電商（剁手）黨，你會說是這個：

如果你是名充滿文藝細胞的音樂發燒友，你會答這個：

沒錯，猜你喜歡、個性歌單，這些都是推薦系統的輸出內容。從這些我們就可以總結出，推薦系統到底是做什麼的。

目的1. 幫助使用者找到想要的商品（新聞/音樂/……），發掘長尾

　　幫使用者找到想要的東西，談何容易。商品茫茫多，甚至是我們自己，也經常點開淘寶，面對眼花繚亂的打折活動不知道要買啥。在經濟學中，有一個著名理論叫長尾理論（The Long Tail）。

套用在網際網路領域中，指的就是最熱的那一小部分資源將得到絕大部分的關注，而剩下的很大一部分資源卻鮮少有人問津。這不僅造成了資源利用上的浪費，也讓很多口味偏小眾的使用者無法找到自己感興趣的內容。

目的2. 降低資訊過載

　　網際網路時代資訊量已然處於爆炸狀態，若是將所有內容都放在網站首頁上使用者是無從閱讀的，資訊的利用率將會十分低下。因此我們需要推薦系統來幫助使用者過濾掉低價值的資訊。

目的3. 提高站點的點選率/轉化率

　　好的推薦系統能讓使用者更頻繁地訪問一個站點，並且總是能為使用者找到他想要購買的商品或者閱讀的內容。

目的4. 加深對使用者的瞭解，為使用者提供定製化服務

　　可以想見，每當系統成功推薦了一個使用者感興趣的內容後，我們對該使用者的興趣愛好等維度上的形象是越來越清晰的。當我們能夠精確描繪出每個使用者的形象之後，就可以為他們定製一系列服務，讓擁有各種需求的使用者都能在我們的平臺上得到滿足。

二、推薦系統的分類

三、主要的推薦演算法

推薦演算法大致可以分為以下幾類

基於流行度的演算法
協同過濾演算法（user-based CF and item-based CF）
基於內容的演算法（content-based）
基於模型的演算法
混合演算法

1. 基於流行度的演算法

可以按照一個專案的流行度進行排序，將最流行的專案推薦給使用者。比如在微博推薦中，將最為流行的大V使用者推薦給普通使用者。微博每日都有最熱門話題榜等等。

這種演算法的優點是簡單，適用於剛註冊的新使用者。缺點也很明顯，它無法針對使用者提供個性化的推薦。

2. 基於內容的演算法

基於內容的推薦（Content-based Recommendation）是資訊過濾技術的延續與發展，它是建立在專案的內容資訊上作出推薦的，而不需要依據使用者對專案的評價意見，更多地需要用機器學習的方法從關於內容的特徵描述的事例中得到使用者的興趣資料。在基於內容的推薦系統中，專案或物件是通過相關的特徵的屬性來定義，系統基於使用者評價物件的特徵，學習使用者的興趣，考察使用者資料與待預測專案的相匹配程度。

基於內容的推薦演算法（Content-Based Recommendations CB）是最早被使用的推薦演算法，它的思想非常簡單：根據使用者過去喜歡的物品（本文統稱為 item），為使用者推薦和他過去喜歡的物品相似的物品。而關鍵就在於這裡的物品相似性的度量，這才是演算法運用過程中的核心。 CB最早主要是應用在資訊檢索系統當中，所以很多資訊檢索及資訊過濾裡的方法都能用於CB中。

3.協同過濾演算法

顧名思義，它是通過集體智慧的力量來進行工作，過濾掉那些使用者不感興趣的專案。協同過濾是基於這樣的假設：為特定使用者找到他真正感興趣的內容的好方法是首先找到與此使用者有相似興趣的其他使用者，然後將他們感興趣的內容推薦給此使用者。

它一般採用最近鄰技術，利用使用者的歷史喜好資訊計算使用者之間的距離，然後利用目標使用者的最近鄰居使用者對商品評價的加權評價值來預測目標使用者對特定商品的喜好程度，系統從而根據這一喜好程度來對目標使用者進行推薦，通常需要用到UI矩陣的資訊。協同過濾推薦又可以根據是否運用機器學習的思想進一步劃分為基於記憶體的協同過濾推薦（Memory-based CF）和基於模型的協同過濾推薦(Model-based CF)。

4. 基於模型的演算法

協同過濾演算法在大資料情況下，由於計算量較大，不能做到實時的對使用者進行推薦。基於模型的協同過濾演算法有效的解決了這一問題，矩陣分解（Matrix Factorization, MF）是基於模型的協同過濾演算法中的一種。在基於模型的協同過濾演算法中，利用歷史資料訓練得到模型，並利用該模型實現實時推薦

5. 混合演算法

現實應用中，其實很少有直接用某種演算法來做推薦的系統。在一些大的網站如Netflix，就是融合了數十種演算法的推薦系統。我們可以通過給不同演算法的結果加權重來綜合結果，或者是在不同的計算環節中運用不同的演算法來混合，達到更貼合自己業務的目的。

推薦系統入門——初步理解

一、什麼是推薦系統？

推薦系統的定義

推薦系統存在的意義

二、推薦系統的分類

三、主要的推薦演算法

1. 基於流行度的演算法

2. 基於內容的演算法

3.協同過濾演算法

4. 基於模型的演算法

5. 混合演算法

推薦系統入門——初步理解

推薦系統入門

推薦系統入門必讀論文

推薦系統入門必讀的經典paper

基於使用者(user-based)的協同過濾推薦演算法的初步理解以及程式碼實現

程式設計師的機器學習入門筆記（七）：推薦系統入門介紹

大數據入門第十九天——推薦系統與mahout（一）入門與概述

即時通訊（文字，圖片，視頻）包括坐席調度排隊系統初步理解

一文簡單理解“推薦系統”原理及架構

推薦系統從入門到 Spark 案例實踐

推薦系統演算法工程師-從入門到就業

電影推薦系統設計思路（簡單易懂的演算法理解）

【mahout筆記】初步理解userCF（基於使用者的推薦演算法）在mahout的實現

推薦系統中準確率和召回率的理解

神經網路與推薦系統初步簡介

推薦系統從入門到精通的過程

【mahout筆記】初步理解itemCF（基於物品的推薦演算法）在mahout的實現

23張圖，帶你入門推薦系統

Log4j 入門概念理解

推薦系統學習之評測指標

推薦系統入門——初步理解

一、什麼是推薦系統？

推薦系統的定義

推薦系統存在的意義

二、推薦系統的分類

三、主要的推薦演算法

1. 基於流行度的演算法

2. 基於內容的演算法

3.協同過濾演算法

4. 基於模型的演算法

5. 混合演算法

相關推薦