Music Recommendation System with User-based and Item-based Collaborative Filtering Technique(使用基於用戶及基於物品的協同過濾技術的音樂推薦系統)【更新】
摘要:
大數據催生了互聯網,電子商務,也導致了信息過載。信息過載的問題可以由推薦系統來解決。推薦系統可以提供選擇新產品(電影,音樂等)的建議。這篇論文會介紹一個音樂推薦系統,他會根據用戶的歷史行為和口味向用戶推薦歌曲。本文介紹一種基於用戶和物品的協同過濾技術。首先,建立一個用戶-物品相關矩陣來形成用戶集群和物品集群。然後,使用這些集群找出和目標用戶最相似的用戶集群和物品集群。最後,系統會根據最相似的用戶和物品集群來推薦音樂。該算法將在基準數據集Last.fm上進行實施。實驗結果顯示該算法的表現要優於最熱門的基準算法。
關鍵字:推薦系統;協同過濾; 相似度估計
1.引言
進入電子商務和互聯網時代後,信息開始如血液般流動。推薦系統是一種解決信息過載問題的工具。推薦系統由兩種實體:用戶和物品所組成。用戶就是網上商店的顧客,物品就是商品。現今有大量推薦系統的應用,例如電影推薦系統,書籍推薦系統,音樂推薦系統等。這篇論文將會討論音樂推薦系統。在音樂推薦系統中,用戶就是聽眾,物品就是歌曲。
音樂無處不在。每個人只要點擊鼠標就能傾聽數之不盡的音樂。隨著歌曲,樂隊和藝術家的數量越來越多,聽眾很難做出選擇。用戶想要找到合自己音樂口味的歌曲。音樂推薦系統就是在這種情況下誕生了。Many services like Pandora, Spotify, and Last.fm [1] have come up in order to provide recommendations to users.Netflix組織了百萬歌曲數據集挑戰賽,希望參賽者能夠設計出在Last.fm數據集上具有良好表現的推薦系統。要求對音樂的選擇基於用戶對某些藝術家的口味,偏愛和信任。為一個軟件或者一部機器量化所有這些因素是很難的。因此找到真正使用戶感興趣,合乎用戶口味的歌曲是很難的。Every music recommendations system works on a given set of assumptions in order to provide effective recommendations。
文學領域的兩種標準推薦系統是協同過濾推薦系統和基於內容的推薦系統。協同過濾基於其他用戶的行為進行推薦,而基於內容的系統基於物品的內容進行推薦。
論文的其余部分內容組織如下:
第二部分解釋相關研究,第三部分討論算法,第四部分討論算法的效果,第五部分進行總結和指明未來的研究方向。
2.相關研究
2.1 用戶-物品相關矩陣
協同過濾技術基於用戶-物品相關矩陣這種數據結構。在這種數據結構中記錄著每個用戶和每種物品之間的相關性。
其中Sij是用戶i(Ui)聽歌曲j(Ij)的次數。
2.2 協同過濾技術
協同過濾技術是推薦系統中最常用的技術。協同過濾技術的基本思想是:如果用戶的口味不變,則他過去喜歡的東西,他在未來也會喜歡。
協同過濾技術可以分為以下兩類。
2.2.1 基於用戶的協同過濾
這種方法的主要思想是找到與當前目標用戶最相近的所有用戶,然後嘗試推薦目標用戶可能會喜歡的物品。
2.2.2 基於物品的協同過濾
Music Recommendation System with User-based and Item-based Collaborative Filtering Technique(使用基於用戶及基於物品的協同過濾技術的音樂推薦系統)【更新】