推薦系統資料集
Movielens Dataset:
其中Movielens-100k和movielens-1M有使用者對電影的打分,電影的title、genre、IMDB連結、使用者的gender、age、occupation、zip code。movielens-10M中還有使用者對電影使用的tag資訊。
HetRec2011 Dataset:包括了movielens-2k、delicious-2k和last.fm-2k。
在movielens-2k中,電影的資訊更加豐富了,有IMDB和Rotten Tomatoes的資訊,具體還有電影對應的genre、director、actor、發行的國家、拍攝的地點、tag資訊,當然還有打分資訊。 在delicious-2k中,是使用者對bookmark(書籤)的tag資訊。具體包括使用者之間的relation、書籤的title和url、使用者對書籤使用的tag。這個資料集適用於tag的推薦。 在last.fm-2k中,是使用者收聽音樂的資訊。具體包括雙向的朋友關係、藝術家、使用者收聽藝術家資訊(有weight)、使用者對藝術家的tag資訊、藝術家tag資訊。
Wikilens Dataset
BookCrossing Dataset: 使用者對書的打分資訊,使用者城市、使用者年齡、書在Amazon的資訊及url。
Jest Joker Dataset
Eachmovie Dataset
(下圖摘自論文Recommender System Survey)
另外還有一些社交網路分析的資料集
http://snap.stanford.edu/na09/resources.html
相關推薦
推薦系統資料集
Movielens Dataset: 其中Movielens-100k和movielens-1M有使用者對電影的打分,電影的title、genre、IMDB連結、使用者的gender、age、occupation、zip code。movielens
推薦系統資料統計
最好通過電子版和網路查詢,Ctrl + F,儘量不要用肉眼去找,效率極低。 Netflix:80% 被觀看的電影來自推薦 [1] Gomez-Uribe C A, Hunt N. The Netflix recommender system: Algorithms, business
Coursera課程下載和存檔計劃三:機器學習 & 自然語言處理 & 推薦系統 & 資料探勘相關公開課
週末對之前儲存和下載的Coursera課程做了一下整理和歸類,先送出機器學習、自然語言處理、推薦系統和資料探勘相關的14門課程資源。這些公開課資源很多來自於之前課程圖譜群內朋友的或者微博上的朋友的分享,這裡做了一些補充,主要針對Coursera舊課程平臺的課程進行備份和分享
【推薦演算法工程師技術棧系列】推薦系統--資料效果與評估
目錄 推薦系統上線的基本條件 AB實驗 功能列表 資料指標 覆蓋率 AUC及gAUC 指標展示 指標監控
推薦系統研究中的九大資料集
原文地址 ps:對原文有所刪減 在這篇部落格中,作者介紹了九個資料集,其中一些是推薦系統中常用到的標準資料集,也有一些是非傳統意義上的資料集(non-traditional datasets),作者相信,這些非傳統資料集更接近真實場景的資料。 首先,先說明下推薦系統資料中的幾個類別
推薦系統 會議+學者+課程+資料集
前言 推薦系統是一個相當火熱的研究方向,在工業界和學術界都得到了大家的廣泛關注。希望通過此文,總結一些關於推薦系統領域相關的會議、知名學者,以及做科研常用的資料集、程式碼庫等,一來算是對自己涉獵推薦系統領域的整理和總結,二來希望能夠幫助想入門推薦系統的童鞋們提供一個參考,希
推薦系統:MovivLens20M資料集解析
MovieLens 是歷史最悠久的推薦系統。它由美國 Minnesota 大學電腦科學與工程學院的 GroupLens 專案組創辦,是一個非商業性質的、以研究為目的的實驗性站點。MovieLens 主要使用 Collaborative Filtering
【推薦系統】推薦系統常用資料集
最近在做融合評論資訊的推薦系統,找到了許多資料集,就在這裡總結一下吧。 Retailrocket 商品評論和推薦資料 The dataset consists of three files: a f
用MovieLens資料集做推薦(Python推薦系統二)
思路:下載MovieLens的資料集,對資料集進行函式定義,定義各資料列的名稱,根據上一篇Python寫出簡單的推薦系統(一) 文中的recommendations.py 的使用者相似度進行推薦。 下載MovieLe
推薦系統研究相關的資料集
因為最近要做一些關於推薦系統相關的研究,所以查閱了一些資料,總結一下市面上能用到推薦系統研究方面的常用公開資料集。 作者:張昭 haolexiao Jester線上笑話評分資料集 這個資料集是Jester這個伯克利專門用來收集資料集的線上笑話網
16個推薦系統開放公共資料集整理分享
(本文由深度學習與NLP編譯) 本文主要整理了一些與推薦系統相關的高質量的資料集。整理自Stack Overflow、一些文章、推薦站點和學術實驗。其中,大多數資料集都是免費、開放的,但有些不是,需要獲得許可或引用作者的工作才能使用。此外,其中也包含一些預處理資料,可用於學
推薦系統實踐(八)--movieslens資料集簡介
1、資料集簡介MovieLens資料集包含多個使用者對多部電影的評級資料,也包括電影元資料資訊和使用者屬性資訊。這個資料集經常用來做推薦系統,機器學習演算法的測試資料集。尤其在推薦系統領域,很多著名論文都是基於這個資料集的。(PS: 它是某次具有歷史意義的推薦系統競賽所用的資料集)。2、資料介紹1m的資料解壓
推薦系統實踐 0x05 推薦資料集MovieLens及評測
# 推薦資料集MovieLens及評測 ## 資料集簡介 MoiveLens是GroupLens Research收集併發布的關於電影評分的資料集,規模也比較大,為了讓我們的實驗快速有效的進行,我們選取了釋出於2003年2月的 MovieLens 1M,這個資料集包含6000個使用者對4000個電影的一百萬
【Mark Schmidt課件】機器學習與資料探勘——推薦系統
本課件主要內容: 上次課程回顧:隱因子模型 魯棒PCA 隱因子模型的變化形式 Netflix獎 協同過濾問題 協同過濾的矩陣分解 基於內容的濾波 vs. 協同濾波 混合方法 SVD特徵的隨機梯度
大資料推薦系統架構
推薦系統介紹 當下,個性化推薦成了網際網路產品的標配。但是,人們對推薦該如何來做,也就是推薦技術本身,還不甚瞭解。為此,好學的你肯定在收藏著朋友圈裡流傳的相關文章,轉發著微博上的相關討論話題,甚至還會不斷奔走在各種大小行業會議之間,聽著大廠職工們講那些乾貨。我知道,這樣碎片化的吸收,增加了知識的
推薦書籍必有連結】利用python進行資料分析與推薦系統
資料分析是指用適當的統計分析方法對收集來的大量資料進行分析,提取有用資訊和形成結論而對資料加以詳細研究和概括總結的過程。這一過程也是質量管理體系的支援過程。在實用中,資料分析可幫助人們作出判斷,以便採取適當行動 由於有很多小夥伴們,在後臺諮詢有沒有資料分析相關的推薦,這裡推薦一本在京東上
《推薦系統實踐》第六章 利用社交網路資料
6.1 獲取社交網路資料的途徑 6.1.1 電子郵件 我們可以通過分析使用者的聯絡人列表瞭解使用者的好友資訊,而且可以進一步通過研究兩個使用者之間的郵件往來頻繁程度度量兩個使用者的熟悉程度。 如果我們獲得了使用者的郵箱,也可以通過郵箱字尾得到一定的社交關係資訊。很多社交網站都在使用者註冊
《推薦系統實踐》第四章 利用使用者標籤資料
目前流行的推薦系統基本上通過3種方式聯絡使用者興趣和物品。 第一種方式是利用使用者喜歡過的物品,給使用者推薦與他喜歡過的物品相似的物品,這就是前面提到的基於物品的演算法。 第二種方式是利用和使用者興趣相似的其他使用者,給使用者推薦那些和他們興趣愛好相似的其他使用者喜歡的物品,這是前面提到的基
《推薦系統實踐》第二章 利用使用者行為資料
2.1 使用者行為資料簡介 在電子商務網站中行為主要包括網頁瀏覽、購買、點選、評分和評論等。 使用者行為在個性化推薦系統中一般分兩種——顯性反饋行為(explicit feedback)和隱性反饋行為(implicit feedback)。顯性反饋行為包括使用者明確表示對物品喜好的行為。隱性
基於系統呼叫的系統異常檢測的可用資料集總結
因為我主要研究的是通過監控系統呼叫進而判斷系統是否異常,所以最近在整理關於系統異常檢測可用的資料集。目前蒐集到的資料集主要有UNM,ADFA等。 (一)UNM Dataset UNM資料集是新墨西哥大學為了研究入侵免疫系統而採集的資料集。該網站的主頁是這樣的: 下載的地址是:https