【推薦演算法】DeepFM

阿新 • • 發佈：2021-06-30

DeepFM主要解決了Wide & Deep的以下幾個痛點：

wide部分特徵自動交叉。Wide & Deep中的wide部分需要手工做特徵工程，DeepFM向wide部分引入FM模組，使wide部分能夠自動組合二階交叉特徵，可以實現端到端的訓練。

演算法

如圖，整個網路可以看作三個部分：一階部分+二階部分+MLP。也可以看作兩個部分：FM+MLP。其中，FM是低階交叉部分，可以看做Wide & Deep中的Wide部分；MLP即為Deep部分。FM與MLP共享所有embedding，沒有額外的手工特徵交叉，可以實現端到端訓練。

模型輸入

FM與MLP部分的定義在前面的章節介紹過，只需要重新設計前向傳播過程即可。

class DeepFactorizationMachineModel(torch.nn.Module):
    def __init__(self, field_dims, embed_dim=16, mlp_dims=(16, 16), dropout=0.2):
        super().__init__()
        self.linear = FeaturesLinear(field_dims)
        self.fm = FactorizationMachine(reduce_sum=True)
        self.embedding = FeaturesEmbedding(field_dims, embed_dim)
        self.embed_output_dim = len(field_dims) * embed_dim
        self.mlp = MultiLayerPerceptron(self.embed_output_dim, mlp_dims, dropout)

    def forward(self, x):
        """
        :param x: Long tensor of size ``(batch_size, num_fields)``
        """
        embed_x = self.embedding(x)
        x = self.linear(x) + self.fm(embed_x) + self.mlp(embed_x.view(-1, self.embed_output_dim))
        return torch.sigmoid(x.squeeze(1))

模型效果

設定：
資料集：ml-100k
優化方法：Adam
學習率：0.003

效果：
收斂epoch：6
train logloss: 0.53571
val auc: 0.78205
test auc: 0.78592

【推薦演算法】DeepFM

DeepFM主要解決了Wide & Deep的以下幾個痛點： wide部分特徵自動交叉。Wide & Deep中的wide部分需要手工做特徵工程，DeepFM向wide部分引入FM模組，使wide部分能夠自動組合二階交叉特徵，可以實現端到端的訓

【推薦演算法】基於使用者協同過濾演算法

\"\"\" ORM外部呼叫的配置： \"\"\" import numpy as np import math import os def orm_standby(): os.environ.setdefault(\"DJANGO_SETTINGS_MODULE\", \"TravelRecommend.settings\")# manage.py檔案中有同樣的

【推薦演算法】邏輯迴歸（Logistic Regression，LR）

邏輯迴歸（Logistic Regression，LR）在推薦系統發展歷史中佔非常重要的地位。其優勢主要體現在三個方面：

【推薦演算法】因子分解機（Factorization Machines，FM）

因子分解機（Factorization Machines，FM）主要解決了LR的以下幾個痛點：實現自動特徵交叉。LR只能只能手工設計特徵之間的交叉，依賴大量人力與業務知識，並且無法挖掘業務構建特徵的盲點；

【推薦演算法】Wide & Deep

Wide & Deep主要解決了FM的以下幾個痛點：強化記憶能力。FM這類embedding類模型擁有強大的泛化能力，在embedding的過程中傳入了大量的全域性資訊，對於一些很少出現甚至沒有出現過的特徵組合，也能計算出合理的

【二分】【匈牙利演算法】導彈

Description 給出一張無向的完全圖(任意兩點之間都有一條邊的圖)\\(G=(V,E)\\)，它可以表示出某一塊大陸的地圖：每個頂點表示一座城市，每條邊代表連線的兩個城市間的距離，該大陸任兩個城市都是直接連通的。另外在這

【kmp演算法】C++程式碼實現

推薦先在B站搜尋KMP看一個印度小哥講解的視訊： https://www.bilibili.com/video/BV1Ys411d7yh

【字串演算法】AC自動機

國慶後面兩天划水，甚至想接著發出咕咕咕的叫聲。咳咳咳，這些都不重要!最近學習了一下AC自動機，發現其實遠沒有想象中的那麼難。

【字串演算法】字典樹(Trie樹)

什麼是字典樹基本概念字典樹，又稱為單詞查詢樹或Tire樹，是一種樹形結構，它是一種雜湊樹的變種，用於儲存字串及其相關資訊。

【推薦系統】01 簡介

00 內容總覽 01 推薦系統的目的分類目錄、搜尋引擎和推薦系統是資訊過載所採用的不同措施。

【推薦系統】3.深入理解PNN模型--加入Product層【轉】

參考：https://blog.csdn.net/Blank_spaces/article/details/107479246 前言本次分享一篇2016年提出的模型PNN（Product-based Neural Networks for User Response Prediction）。本文的主要創新點是在Embedding與M