推薦系統應用研究:音樂電臺
推薦系統很少有單獨的產品形態,多是和其他產品相結合,起到輔助的使用效果。如個人平時使用較多的推薦系統有輸入法的字詞聯想、購書網站中書籍推薦、音樂電臺的猜使用者喜歡的音樂和谷歌閱讀器的推薦條目。
對於豆瓣音樂頻道使用較少,雖然對音樂沒什麼研究,也不會買什麼專輯或者聽演唱會,但是很喜歡聽音樂,有邊工作邊聽音樂的習慣。豆瓣電臺迄今累計收聽13670首、喜歡136首和不喜歡666首,算是電臺的重度使用者吧,個人操作行為有:
- 作為工作時間的背景音樂,處於後臺執行狀態。有時候工作入神,只要不是特別討厭或者特別喜歡的歌曲一般不會去訪問電臺網頁。
- 離開工位的時候,拿下耳機不關閉音樂,1萬多首歌裡起碼有30%沒有真正聽。
- 聽到廣告和“哈狗幫”之類吵鬧的音樂會找到電臺的網頁,選擇不喜歡,無法停止的廣告直接點選關閉電臺,因為很容易導致走神影響工作。
- 聽到喜歡的音樂60%的概率會找到電臺網頁點選“喜歡”。
- 發現特別喜歡或者寄希望能推薦相關歌曲時會去點選“喜歡”。
- 聽到不怎麼喜歡的音樂也會選擇點選“下一首”。
豆瓣電臺推薦新歌力度比蝦米網強,操作也更方便,不需要像蝦米網的初始化時選擇喜歡的歌手和選擇喜歡音樂之後要選擇標籤,更加智慧化,減少操作步驟。蝦米的歌庫好像不夠全,多是推薦大眾化的歌曲,但推薦的形式比豆瓣更豐富和取巧。 www.yixieshi.com
豆瓣不支援按歌手和專輯聽歌,如果連續點選三次“不喜歡”沒有聽到喜歡的音樂或者經常播放討厭怨女情歌,可能會選擇聽蝦米網歌手專輯。如果能選擇只聽自己已經選擇喜歡的100多首歌曲,或許不會切換到其他產品。
豆瓣電臺通常作為瀏覽器的書籤單獨存在,通常直接訪問豆瓣電臺而不會從豆瓣主頁再訪問豆瓣電臺,從電臺返回到豆瓣主頁只能手動修改網址或者點選專輯的連結檢視專輯再返回主頁。把喜歡歌曲的紅心去掉,是不是意味著使用者不再喜歡這首歌並要跳到下一首歌。 www.yixieshi.com
豆瓣電臺在開始做之前,已經有了比較完善的初始化的資料,大部分專輯都有標籤和評分,如專輯《我們是五月天》的相關元資料為:
- 9592人平均評分為9.3。
-
標籤有:五月天(2450),臺灣(701) , MAYDAY(644),我們是五月天(374),搖滾(338),我們是:),五月天(264),rock(201),pop(160)
- 每首歌收藏的人數。
從以上的標籤可以看出,歌手、地區和音樂風格是使用者的常用標籤,可以假設這三個標籤是影響使用者選擇的最主要元資料。英文MAYDAY、五月天、我們是五月天和我們是:),五月天是等價的標籤,搖滾和rock是等價的標籤,不存在像谷歌挑歌那樣的互斥性標籤(如節奏的舒緩和強烈)。從這個例子也可以看出使用者語言具有模糊性,有必要使用受控詞表來控制同義標籤的不同語言表達方式。
豆瓣的使用者群比較小眾化,新增的標籤質量比較高,使用標籤可以簡單地組織歌曲之間的聯絡,利用評分、收藏人數和標籤數目可以確定推薦的優先順序。
如使用者在電臺中選擇喜歡專輯《我們是五月天》中的歌曲《擁抱》,那可能依照歌手推薦會更可靠,使用者選擇多首五月天的歌曲,那可以認定是五月天的粉絲了,歌庫中添加了五月天的新歌,自當第一時間推薦。
與風格相比,地區的影響程度更低,但是不排除部分使用者有這方面的偏好,比如只聽華語的歌曲,這需要經過決策樹之類方法多次推薦才能論證。選擇風格“搖滾”,可以推薦標籤為搖滾並且評分比較高的歌手,逐步確認使用者的音樂喜好模型。在大力推薦歌曲之前,可以先完成對使用者喜歡歌曲的收集。在不確定的情況下,可以多播放已喜歡的音樂或者喜歡歌手的熱門歌曲。 www.yixieshi.com
使用者喜歡的歌手有很多,但是喜歡的風格不會很多,同一風格下有很多歌手,使用者喜歡的風格比歌手更復雜和模糊。歌手之間是並列的標籤,而風格會形成明顯的偏向。隨著時間的改變,風格也會發生改變。www.yixieshi.com
另外,標籤要和歌曲更吻合,聽到電臺推薦雜音多的五月天演唱會歌曲,會選擇不喜歡或者跳到下一首。系統或許會依此誤以為使用者不喜歡這首歌,低質量的歌曲會影響系統推薦的準確性。
來源:http://daichuanqing.com/index.php/archives/1880?utm_source=rss&utm_medium=rss&utm_campaign=%25e6%258e%25a8%25e8%258d%2590%25e7%25b3%25bb%25e7%25bb%259f%25e5%25ba%2594%25e7%2594%25a8%25e7%25a0%2594%25e7%25a9%25b6%25ef%25bc%259a%25e9%259f%25b3%25e4%25b9%259