因子分解機FM原理及SGD訓練

阿新 • • 發佈：2019-01-20

1.背景

Steffen Rendle於2010年提出Factorization Machines（下面簡稱FM），併發布開源工具libFM。FM的提出主要對比物件是SVM，與SVM相比，有如下幾個優勢
（1）對於輸入資料是非常稀疏（比如自動推薦系統），FM可以，而SVM會效果很差，因為訓出的SVM模型會面臨較高的bias。
（2）FMs擁有線性的複雜度, 可以通過 primal 來優化而不依賴於像SVM的支援向量機。

2.模型

2-way FM(degree = 2)是FM中具有代表性，且比較簡單的一種。就以其為例展開介紹。其對輸出值是如下建模

其中，，，，n表示特徵維度

表示兩個大小為k的向量

和

的點積

k是定義factorization維度的超引數，是正整數
因子分解機FM也可以推廣到高階的形式，即將更多互異特徵分量之間的相互關係考慮進來。

3.用途

（1）迴歸問題(Regression)：可以採用最小均方誤差作為優化的標準（深入理解可以從高斯分佈、極大似然估計入手）
（2）二分類問題(Binary Classification)：利用sigmoid函式。詳細原因見地址
（3）排序(Ranking)

4.交叉項係數

（1）示例
樣本資料

FM交叉項係數

（2）求解
表面上看FM模型的第3項的計算複雜度為O(kn^2)，但其實可以經過簡單的數學處理，計算複雜度降為O(kn)。

數學原理：主要是採用瞭如公式((a+b+c)2−a2−b2−c2求出交叉項

5.SGD求解引數

本文利用隨機梯度下降SGD進行引數學習，也是一種簡單的線上學習方法。

隨機梯度下降與梯度下降主要差別在於batch size不一樣

注：大家可以根據自己需要定義Loss Function，通過梯度下降得到引數更新的公式

最初的V通過正態分佈的形式給出
所示程式碼是通過簡單的似然估計進行二分類從而進行引數更新

後續會更新利用FTRL訓練FM

因子分解機FM原理及SGD訓練

1.背景

2.模型

3.用途

4.交叉項係數

5.SGD求解引數

因子分解機FM原理及SGD訓練

因子分解機(FM) +場感知分解機 (FFM) 入門

因子分解機 FM和FFM

ml課程：FM因子分解機介紹及相關程式碼

FM（因子分解機系列）

FM（Factorization Machine，因子分解機）演算法個人理解

萬字長文，詳解推薦系統領域經典模型FM因子分解機

光纖鐳射打標機的原理及特點

簡單易學的機器學習演算法——因子分解機(Factorization Machine)

【機器學習】支援向量機SVM原理及推導

因子分解機（libffm+xlearn）

感知機演算法原理及推導

RBM（受限玻爾茲曼機）原理及程式碼

從SVD、SVD++到因子分解機

推薦系統學習筆記之四 Factorization Machines 因子分解機 + Field-aware Factorization Machine(FFM) 場感知分解機

奇異值分解SVD計算原理及JAVA程式碼

（一）因式分解機（Factorization Machine，FM）原理及實踐

學一點 mysql 雙機異地熱備份----快速理解mysql主從，主主備份原理及實踐

奇異值分解(SVD)原理及應用

ssh原理及管理機分發公鑰方法

因子分解機FM原理及SGD訓練

1.背景

2.模型

3.用途

4.交叉項係數

5.SGD求解引數

相關推薦