論文復現——AutoRec: Autoencoders Meet Collaborative Filtering

阿新 • • 發佈：2021-08-16

《AutoRec: Autoencoders Meet Collaborative Filtering》是2015年Suvash等人發表在“The Web Conference”會議上的一篇論文，作者提出用自編碼器預測使用者對電影的評分。論文比較短，只有兩頁，可以說是深度學習在推薦系統領域應用的開端。

ABSTRACT

本文提出了一個新穎的基於自編碼器的協同過濾框架——AutoRec。實驗表明，AutoRec在Movielens資料集上的表現優於目前最好的方法（矩陣分解、受限玻爾茲曼機、LLORMA）。

THE AUTOREC MODEL

假設有\(m\)個使用者，\(n\)個商品，並且有使用者對商品的評分矩陣\(R\in \mathbb{R}^{m\times n}\)

，則使用者\(u\)對所有商品的評分可以用不完全的向量\(r^{(u)}={R_{u1},...,R_{u2}}\)表示（不完全意思是，\(r^{(u)}\)中的元素有的是真實的評分資料，有的是需要我們預測的）。自編碼器的作用就是將\(r^{(u)}\)作為輸入資料，經過編碼器將向量對映維一個低維的向量，然後通過解碼器重構輸出向量，使輸出向量趨近於輸入向量，同時能夠補全原始輸入向量中的缺失值。自編碼器模型可以表示為：

\[min\sum_{r\in S}^{}\left \| r-h(r;\theta ) \right \|^{2}_{2} \]

程式碼復現

完整程式碼及資料集已上傳至github


import os
import torch
import numpy as np
import pandas as pd
import torch.nn as nn
import torch.utils.data as Data
import matplotlib.pyplot as plt

os.environ['KMP_DUPLICATE_LIB_OK'] = 'TRUE'


col_name = ["userid", "movieid", "rating", "timestrap"]
u1_base_path = "data/u1.base"
u1_base = pd.read_table(u1_base_path, sep='\t', header=None, names=col_name)
# print(u1_base.head(5))

u1_test_path = "data/u1.test"
u1_test = pd.read_table(u1_test_path, sep='\t', header=None, names=col_name)
# print(u1_test.head(5))


# 將資料轉換為 user-item 互動矩陣
def TranslateData(data):
    user_num = data.userid.nunique()  # 使用者的個數
    movie_num = 1682  # 電影個數（資料中標明的所有電影數）
    data_mat = np.zeros(user_num * movie_num).reshape((-1, movie_num)) + 3

    k = 0
    for i in range(data.shape[0]):
        data_mat[k][data.iloc[i, 1] - 1] = data.iloc[i, 2]
        if i > 0 and data.iloc[i, 0] != data.iloc[i - 1, 0]:
            k += 1

    return data_mat


class AutoRec(nn.Module):
    def __init__(self, input_num, hidden_num):
        super(AutoRec, self).__init__()
        self.input_num = input_num
        self.hidden_num = hidden_num
        self.encoder = nn.Linear(self.input_num, self.hidden_num, bias=True)
        self.relu = nn.ReLU()
        self.decoder = nn.Linear(self.hidden_num, self.input_num, bias=True)

    def forward(self, x):
        hidden = self.encoder(x)
        hidden = self.relu(hidden)
        out = self.decoder(hidden)

        return out


def GetData(data_mat):
    dataset = Data.TensorDataset(torch.tensor(data_mat, dtype=torch.float32),
                                 torch.zeros(data_mat.shape[0], 1).view(-1, 1))

    loader = Data.DataLoader(
        dataset=dataset,
        batch_size=64,
        shuffle=False
    )

    return loader


epochs = 100
input_num, hidden_num = 1682, 200
model = AutoRec(input_num, hidden_num)
learning_rate = 0.0003
optimizer = torch.optim.Adam([
        {'params': (p for name, p in model.named_parameters() if 'bias' not in name)},
        {'params': (p for name, p in model.named_parameters() if 'bias' in name), 'weight_decay': 0.}
    ], lr=learning_rate, weight_decay=0.001)
loss_func = torch.nn.MSELoss()
loss_train_set = []
loss_test_set = []


def run():
    train()
    draw(loss_train_set)


def train():
    train_data_mat = TranslateData(u1_base)
    r = train_data_mat[0]
    train_loader = GetData(train_data_mat)

    for epoch in range(epochs):
        rmse_loss = 0
        for step, (X, y) in enumerate(train_loader):
            out = model(X)
            rmse_loss = torch.sqrt(loss_func(out, X))
            rmse_loss.backward()
            optimizer.step()
        loss_train_set.append(rmse_loss)

        if epoch % 100 == 0:
            print("epoch %d" % (epoch + 1))
    test()


def test():
    test_data_mat = TranslateData(u1_test)
    test_loader = GetData(test_data_mat)
    with torch.no_grad():
        rmse_loss = 0
        for step, (X, y) in enumerate(test_loader):
            out = model(X)
            rmse_loss += torch.sqrt(loss_func(out, X))
        print("test_loss: %f" % (rmse_loss / test_data_mat.shape[0]))


def draw(loss_train_set):
    x = [i for i in range(len(loss_train_set))]
    plt.plot(x, loss_train_set, label="Training loss")
    plt.xlabel("epochs")
    plt.ylabel("rmse")
    plt.legend()
    plt.show()


if __name__ == "__main__":
    run()

論文復現——AutoRec: Autoencoders Meet Collaborative Filtering

《AutoRec: Autoencoders Meet Collaborative Filtering》是2015年Suvash等人發表在“The Web Conference”會議上的一篇論文，作者提出用自編碼器預測使用者對電影的評分。論文比較短，只有兩頁，可以說是深度學習在

論文閱讀筆記：Social Collaborative Filtering for Cold-start Recommendations

論文：Social Collaborative Filtering for Cold-start Recommendations / 使用者冷啟動推薦的社會化協同過濾作者：Suvash Sedhain,Scott Sanner,Darius Braziunas,Lexing Xie,Jordan Christensen 發表刊物

【論文筆記】Neural Collaborative Filtering

摘要近幾年來，神經網路已經在聲音識別等領域取得了巨大的成功，然而關於推薦系統的神經網路研究卻很少有人關注。在本文中，我們提出了一種新的基於神經網路的方法解決推薦系統中的關鍵問題--協同過濾(基於

Neural Collaborative Filtering——論文解讀

摘要近年來，深度神經網路在語音識別、計算機視覺和自然語言處理方面取得了巨大的成就。然而，對推薦系統領域的深度神經網路的探索收到的關注相對較少。

硬幣系列三 | 硬幣自動分類的一個論文復現

書接上回，經過自動檢測和裁剪之後，已經有很多切割整齊的硬幣照片了，再來看看相似檢測的方法。

Neural Collaborative Filtering 神經網路協同過濾

論文的翻譯：https://www.cnblogs.com/HolyShine/p/6728999.html 一、MF協同過濾的侷限性 The innerproduct, which simply combines the multiplication of latent features linearly, may not be sufficient to cap

經典論文復現 | PyraNet：基於特徵金字塔網路的人體姿態估計

此文轉載自：https://my.oschina.net/u/4067628/blog/4767161 大咖揭祕Java人都栽在了哪？點選免費領取《大廠面試清單》，攻克面試難關~>>>

Collaborative Filtering與Content Based推薦演算法（MovieLens資料集）

1 處理思路總體處理思路如圖所示 1.1 演算法選擇協同過濾演算法通過分析，我們發現一共有610位使用者和9742篇電影，為了縮小相似度矩陣的大小，選擇了基於使用者的的協同過濾演算法。

小白經典CNN論文復現系列（一）：LeNet1989

小白的經典CNN復現系列（一）：LeNet-1989 之前的浙大AI作業的那個系列，因為後面的NLP的東西我最近大概是不會接觸到，所以我們先換一個系列開始更新部落格，就是現在這個經典的CNN復現啦(｡･ω･｡)

【論文復現與改進】針對弱標註資料多標籤矩陣恢復問題，改進後的MCWD演算法，讓你的弱標註多標籤資料贏在起跑線上

技術標籤：機器學習演算法python機器學習改進後的MCWD演算法，讓你的弱標註多標籤資料贏在起跑線上

Targeted Backdoor Attacks on Deep Learning Systems Using Data Poisoning 論文復現

技術標籤：深度學習機器學習python深度學習人工智慧安全 Targeted Backdoor Attacks on Deep Learning Systems Using Data Poisoning 論文復現

Visualizing and Understanding Convolutional Networks論文復現筆記

目錄Visualizing and Understanding Convolutional Networks 論文復現筆記AbstractIntroductionApproachVisualization with a Deconvnet關於Deconvnet的實現Convnet Visualization對於一個給定的Feature map，論文中

《RETHINKING POSITIONAL ENCODING IN LANGUAGE PRE-TRAINING》TUPE論文復現

論文《TUPE》復現原有的注意力計算公式拆分為四部分後發現，中間兩部分（word-to-position, position-to-word）對於識別並沒有什麼明顯的作用，並且第一部分（word-to-word）和第四部分論文提出將位置資訊與詞嵌入

Neural Collaborative Filtering閱讀筆記

動機本篇論文是2017年IW3C2上的一篇論文。在當時深度神經網路已經在計算機視覺、自然語言處理等領域取得巨大成功，但是卻很少應用在推薦系統中。雖然當時也有一些工作採用深度學習來進行推薦，但它們主要是用用深度

RAT-SQL論文復現——bug總結與復現流程

復現ACL2020論文：RAT-SQL(paper|code)時遇到的bug總結以及自己的復現流程。嘗試了docker之後遇到一堆坑，最後決定直接使用conda環境。

Neural Graph Collaborative Filtering閱讀筆記

動機本文是2019年SIGIR的一篇文章。在推薦系統中，使用者和物品的向量表示(embeddings)是推薦系統的核心，但目前的方法都是根據使用者（物品）原有的特徵通過對映獲取embeddings，並沒有將使用者與物品互動中的潛在

A Survey on Accuracy-oriented Neural Recommendation From Collaborative Filtering to Content and Context Enriched Recommendation閱讀筆記

簡介本文是2022年TKDE上的一篇論文。本文以推薦模型的準確性為目標，系統地介紹了神經推薦模型，是一篇綜述性論文，閱讀本論文的目的是對推薦系統有一個比較系統的瞭解，確定目前自己學習的方向，同時尋找未來有哪些

論文復現——AutoRec: Autoencoders Meet Collaborative Filtering

ABSTRACT

THE AUTOREC MODEL

程式碼復現

論文復現——AutoRec: Autoencoders Meet Collaborative Filtering

論文閱讀筆記：Social Collaborative Filtering for Cold-start Recommendations

【論文筆記】Neural Collaborative Filtering

Neural Collaborative Filtering——論文解讀

硬幣系列三 | 硬幣自動分類的一個論文復現

Neural Collaborative Filtering 神經網路協同過濾

經典論文復現 | PyraNet：基於特徵金字塔網路的人體姿態估計

Collaborative Filtering與Content Based推薦演算法（MovieLens資料集）

小白經典CNN論文復現系列（一）：LeNet1989

【論文復現與改進】針對弱標註資料多標籤矩陣恢復問題，改進後的MCWD演算法，讓你的弱標註多標籤資料贏在起跑線上

Targeted Backdoor Attacks on Deep Learning Systems Using Data Poisoning 論文復現

Visualizing and Understanding Convolutional Networks論文復現筆記

《RETHINKING POSITIONAL ENCODING IN LANGUAGE PRE-TRAINING》TUPE論文復現

Neural Collaborative Filtering閱讀筆記

RAT-SQL論文復現——bug總結與復現流程

Neural Graph Collaborative Filtering閱讀筆記

A Survey on Accuracy-oriented Neural Recommendation From Collaborative Filtering to Content and Context Enriched Recommendation閱讀筆記

Federated Collaborative Filtering for Privacy-Preserving Personalized Recommendation System閱讀筆記

CBLUE 中文醫療資訊處理基準 NLP (論文復現流程)

Neural Collaborative Filtering

論文復現——AutoRec: Autoencoders Meet Collaborative Filtering

ABSTRACT

THE AUTOREC MODEL

程式碼復現

相關推薦