推薦演算法協同過濾sklearn實現

阿新 • • 發佈：2018-12-10

資料集使用MovieLens資料集在這裡插入圖片描述

import pandas as pd
import numpy as np

header = ['user_id', 'item_id', 'rating', 'timestamp']
dataset = pd.read_csv('../data/u.data',sep='\t',names=header)

#計算唯一使用者和電影的數量
# unique對以為陣列去重  shape[0] shape為矩陣的長度
users = dataset.user_id.unique().shape[0]
items = dataset.item_id.unique().shape[0]
from sklearn.model_selection import train_test_split
train_data,test_data = train_test_split(dataset,test_size=0.25)

'''
建立user-item矩陣
itertuples         pandas dataframe 建立索引的方式
結果為：   Pandas(Index=77054, user_id=650, item_id=528, rating=3, timestamp=891370998)
'''
train_data_matrix = np.zeros((users,items))
for line in train_data.itertuples():
    train_data_matrix[line[1] - 1, line[2] - 1] = line[3]

test_data_matrix = np.zeros((users,items))
for line in test_data.itertuples():
    test_data_matrix[line[1] - 1, line[2] - 1] = line[3]
#計算相似度
from sklearn.metrics.pairwise import pairwise_distances
#相似度相當於權重w
user_similarity = pairwise_distances(train_data_matrix,metric='cosine')
#train_data_matrix.T 矩陣轉置
items_similarity = pairwise_distances(train_data_matrix.T,metric='cosine')

'''
基於使用者相似矩陣 -> 基於使用者的推薦
mean函式求取均值  axis=1 對各行求取均值，返回一個m*1的矩陣
np.newaxis 給矩陣增加一個列 一維矩陣變為多維矩陣 mean_user_rating(n*1)
train_data_matrix所有行都減去mean_user_rating對應行的數    此為規範化評分，使其在統一的範圍內
numpy a.dot(b) -> 兩個矩陣的點積
      np.abs(a) ->計算矩陣a各元素的絕對值
      np.sum()  -> 無引數 矩陣全部元素相加
                -> axis=0   按列相加
                -> axis=1   按行相加
      b /a 矩陣對應為相除
'''
mean_user_rating = train_data_matrix.mean(axis = 1) #計算每行的平均數
rating_diff = train_data_matrix - mean_user_rating[:,np.newaxis]  #評分規範化
print(user_similarity.dot(rating_diff))
pred = mean_user_rating[:, np.newaxis] \
       + user_similarity.dot(rating_diff) / np.array([np.abs(user_similarity).sum(axis=1)]).T  #權重w*平均化的評分

'''
基於物品相似矩陣   ---基於物品的推薦
'''

mahout推薦演算法——協同過濾推薦演算法（java程式碼實現）

什麼是協同過濾協同過濾是利用集體智慧的一個典型方法。要理解什麼是協同過濾 (Collaborative Filtering, 簡稱 CF)，首先想一個簡單的問題，如果你現在想看個電影，但你不知道具體看哪部，你會怎麼做？大部分的人會問問周圍的朋友，看看最近有什麼好看的電影推

【Spark機器學習速成寶典】推薦引擎——協同過濾

屬性寶典系統 ont 宋體 logs images 機器 back 目錄　　推薦模型的分類　　條目2 　　條目3 　　條目4 　　條目5 　　條目6 　　條目7 　　條目8 　　條目9 推薦模型的分類　　最為流行的兩種方法是基於內容的過濾、協

樸素貝葉斯演算法優化與 sklearn 實現

1. 引言上一篇日誌中，我們主要介紹了貝葉斯演算法，並提供了 python 實踐：樸素貝葉斯演算法的推導與實踐但執行上一篇日誌中的示例，我們發現出現了下面的結果： ['love', 'my', 'dalmation'] 屬於非侮辱類 ['stu

基於內容的推薦、協同過濾

基於內容的推薦需要分析內容，無需考慮其他使用者的行為，例如基於使用者喜歡的item的屬性/內容進行推薦通常使用在文字相關產品上進行推薦使用詞袋模型來衡量不同文字的相似度，每個詞的權重可以使用頻率或者tf-idf表示相似

K-means演算法及python sklearn實現

目錄前言例項推演 K值的確定輪廓係數 K-means演算法前言根據訓練樣本是否包含標籤資訊，機器學習可以分為監督學習和無監督學習。聚類演算法是典型的無監督學習，其訓練樣本中只包含樣本特徵，不包含樣本的標

資料探勘十大演算法（一）：決策樹演算法 python和sklearn實現

學完到第三章——決策樹，python程式碼實現的僅是ID3演算法，sklearn為優化過的C4.5，這裡做一個詳細的總結包括（原理、程式碼、視覺化、scikit-learn實現），皆為親自實踐後的感悟。以下進入正文。早前簡單瞭解了決策樹的原理，然後為了儘快使用便沒有深究直

基於矩陣分解的推薦演算法（java程式碼實現）

目前推薦系統中用的最多的就是矩陣分解方法，在Netflix Prize推薦系統大賽中取得突出效果。以使用者-專案評分矩陣為例，矩陣分解就是預測出評分矩陣中的缺失值，然後根據預測值以某種方式向用戶推薦。常見的矩陣分解方法有基本矩陣分解（basic MF），正則化矩

[大資料]ItemBased協同過濾hadoop實現

協同過濾演算法這裡就不再敘述了隨便說一點，通常我們使用的基於物品和使用者的協同過濾演算法於AndrewNG的機器學習描述的有些不一樣視訊中虛擬了一個X出來，然後通過梯度下降法不斷的計算X和theta使costFunction（與y關聯）最小。實際使用中，X這個表示物

基於矩陣分解的電影推薦演算法（使用Tensorflow實現）

#!/usr/bin/env python # -*- coding:utf-8 -*- # 文中部分參考了： # https://blog.csdn.net/u012845311/article/details/77183491 # 改進：要劃分訓練集和測試集，並在進行模型

基於使用者的協同過濾演算法實現的商品推薦系統

基於使用者的協同過濾演算法實現的商品推薦系統專案介紹商品推薦是針對使用者面對海量的商品資訊而不知從何下手的一種解決方案，它可以根據使用者的喜好，年齡，點選量，購買量以及各種購買行為來為使用者推薦合適的商品。在本專案中採用的是基於使用者的協同過濾的推薦演算法來實現

利用Python實現基於協同過濾演算法的影片推薦

協同過濾演算法即對一大群人進行搜尋，找出其中品味與我們相近的一小群人，並將這一小群人的偏好進行組合來構造一個推薦列表。本文利用Python3.5分別實現了基於使用者和基於物品的協同過濾演算法的影片推薦。具體過程如下：先建立了一個涉及人員、物品和評價值的字典，

使用Python的Pandas庫實現基於使用者的協同過濾推薦演算法

本文在下文的程式碼基礎上修改而來：環境版本 Python 3.5.5 Pandas 0.22.0 import pandas as pd df = None def dataSet2Matrix(

【推薦演算法】協同過濾演算法——基於使用者 Java實現

基本概念就不過多介紹了，相信能看明白的都瞭解。如果想了解相關推薦先做好知識儲備： 1.什麼事推薦演算法 2.什麼是基於鄰域的推薦演算法筆者選用的是GroupLens的MoviesLens資料傳送門GroupLens 資料集處理此處擷取資

推薦演算法協同過濾sklearn實現

推薦演算法協同過濾sklearn實現

mahout推薦演算法——協同過濾推薦演算法（java程式碼實現）

推薦系統-協同過濾原理與實現

推薦系統--完整的架構設計和演算法(協同過濾、隱語義)

【Spark機器學習速成寶典】推薦引擎——協同過濾

推薦系統-協同過濾

樸素貝葉斯演算法優化與 sklearn 實現

基於內容的推薦、協同過濾

K-means演算法及python sklearn實現

資料探勘十大演算法（一）：決策樹演算法 python和sklearn實現

基於矩陣分解的推薦演算法（java程式碼實現）

[大資料]ItemBased協同過濾hadoop實現

推薦之協同過濾（思路簡單梳理）

推薦機制協同過濾和基於內容推薦的區別

基於矩陣分解的電影推薦演算法（使用Tensorflow實現）

基於使用者的協同過濾演算法實現的商品推薦系統

推薦系統中協同過濾演算法實現分析（重要兩個圖！！）

利用Python實現基於協同過濾演算法的影片推薦

使用Python的Pandas庫實現基於使用者的協同過濾推薦演算法

【推薦演算法】協同過濾演算法——基於使用者 Java實現

推薦演算法 協同過濾sklearn實現

相關推薦

推薦演算法協同過濾sklearn實現