簡單易學的機器學習演算法——因子分解機(Factorization Machine)

阿新 • • 發佈：2022-05-04

一、因子分解機FM的模型

因子分解機(Factorization Machine, FM)是由Steffen Rendle提出的一種基於矩陣分解的機器學習演算法。

1、因子分解機FM的優勢

對於因子分解機FM來說，最大的特點是對於稀疏的資料具有很好的學習能力。現實中稀疏的資料很多，例如作者所舉的推薦系統的例子便是一個很直觀的具有稀疏特點的例子。

2、因子分解機FM的模型

二、因子分解機FM演算法

因子分解機FM演算法可以處理如下三類問題：

迴歸問題(Regression)
二分類問題(Binary Classification)
排序(Ranking)

在這裡主要介紹迴歸問題和二分類問題。

三、因子分解機FM演算法的求解過程

1、交叉項係數

2、模型的求解

這裡要求出

主要採用瞭如公式

求出交叉項。具體過程如下：

3、基於隨機梯度的方式求解

對於迴歸問題：

對於二分類問題：

而

四、實驗(求解二分類問題)

1、實驗的程式碼：

#coding:UTF-8

from __future__ import division
from math import exp
from numpy import *
from random import normalvariate#正態分佈
from datetime import datetime

trainData = 'E://data//diabetes_train.txt'
testData = 'E://data//diabetes_test.txt'
featureNum = 8

def loadDataSet(data):
    dataMat = []
    labelMat = []
    
    fr = open(data)#開啟檔案
    
    for line in fr.readlines():
        currLine = line.strip().split()
        #lineArr = [1.0]
        lineArr = []
        
        for i in xrange(featureNum):
            lineArr.append(float(currLine[i + 1]))
        dataMat.append(lineArr)
        
        labelMat.append(float(currLine[0]) * 2 - 1)
    return dataMat, labelMat

def sigmoid(inx):
    return 1.0 / (1 + exp(-inx))

def stocGradAscent(dataMatrix, classLabels, k, iter):
    #dataMatrix用的是mat, classLabels是列表
    m, n = shape(dataMatrix)
    alpha = 0.01
    #初始化引數
    w = zeros((n, 1))#其中n是特徵的個數
    w_0 = 0.
    v = normalvariate(0, 0.2) * ones((n, k))
    
    for it in xrange(iter):
        print it
        for x in xrange(m):#隨機優化，對每一個樣本而言的
            inter_1 = dataMatrix[x] * v
            inter_2 = multiply(dataMatrix[x], dataMatrix[x]) * multiply(v, v)#multiply對應元素相乘
            #完成交叉項
            interaction = sum(multiply(inter_1, inter_1) - inter_2) / 2.
            
            p = w_0 + dataMatrix[x] * w + interaction#計算預測的輸出
        
            loss = sigmoid(classLabels[x] * p[0, 0]) - 1
            print loss
        
            w_0 = w_0 - alpha * loss * classLabels[x]
            
            for i in xrange(n):
                if dataMatrix[x, i] != 0:
                    w[i, 0] = w[i, 0] - alpha * loss * classLabels[x] * dataMatrix[x, i]
                    for j in xrange(k):
                        v[i, j] = v[i, j] - alpha * loss * classLabels[x] * (dataMatrix[x, i] * inter_1[0, j] - v[i, j] * dataMatrix[x, i] * dataMatrix[x, i])
        
    
    return w_0, w, v

def getAccuracy(dataMatrix, classLabels, w_0, w, v):
    m, n = shape(dataMatrix)
    allItem = 0
    error = 0
    result = []
    for x in xrange(m):
        allItem += 1
        inter_1 = dataMatrix[x] * v
        inter_2 = multiply(dataMatrix[x], dataMatrix[x]) * multiply(v, v)#multiply對應元素相乘
        #完成交叉項
        interaction = sum(multiply(inter_1, inter_1) - inter_2) / 2.
        p = w_0 + dataMatrix[x] * w + interaction#計算預測的輸出
        
        pre = sigmoid(p[0, 0])
        
        result.append(pre)
        
        if pre < 0.5 and classLabels[x] == 1.0:
            error += 1
        elif pre >= 0.5 and classLabels[x] == -1.0:
            error += 1
        else:
            continue
        
    
    print result
    
    return float(error) / allItem
        
   
if __name__ == '__main__':
    dataTrain, labelTrain = loadDataSet(trainData)
    dataTest, labelTest = loadDataSet(testData)
    date_startTrain = datetime.now()
    print "開始訓練"
    w_0, w, v = stocGradAscent(mat(dataTrain), labelTrain, 20, 200)
    print "訓練準確性為：%f" % (1 - getAccuracy(mat(dataTrain), labelTrain, w_0, w, v))
    date_endTrain = datetime.now()
    print "訓練時間為：%s" % (date_endTrain - date_startTrain)
    print "開始測試"
    print "測試準確性為：%f" % (1 - getAccuracy(mat(dataTest), labelTest, w_0, w, v))

2、實驗結果：

五、幾點疑問

在傳統的非稀疏資料集上，有時效果並不是很好。在實驗中，我有一點處理，即在求解Sigmoid函式的過程中，在有的資料集上使用了帶閾值的求法：

def sigmoid(inx):
    #return 1.0 / (1 + exp(-inx))
    return 1. / (1. + exp(-max(min(inx, 15.), -15.)))

歡迎更多的朋友一起討論這個演算法。

參考文章

1、Rendle, Factorization Machines.

2、Factorization Machines with libFM

簡單易學的機器學習演算法——因子分解機(Factorization Machine)

一、因子分解機FM的模型因子分解機(Factorization Machine, FM)是由Steffen Rendle提出的一種基於矩陣分解的機器學習演算法。

簡單易學的機器學習演算法——Rosenblatt感知機

一、感知機的概念二、感知機模型的訓練 1、目標函式 2、感知機的訓練過程

簡單易學的機器學習演算法——極限學習機(ELM)

一、極限學習機的概念極限學習機(Extreme Learning Machine) ELM，是由黃廣斌提出來的求解單隱層神經網路的演算法。

簡單易學的機器學習演算法——線上順序極限學習機OS-ELM

這篇文章主要是前面整理的，就直接上圖了。實驗： # coding:UTF-8 #################

簡單易學的機器學習演算法——受限玻爾茲曼機RBM

受限玻爾茲曼機(Restricted Boltzmann Machine, RBM)是一種基於能量模型的神經網路模型，在Hinton提出針對其的訓練演算法(對比分歧演算法)後，RBM得到了更多的關注，利用RBM的堆疊可以構造出深層的神經網路模型——深

簡單易學的機器學習演算法——K-Means++演算法

一、K-Means演算法存在的問題由於K-Means演算法的簡單且易於實現，因此K-Means演算法得到了很多的應用，但是從K-Means演算法的過程中發現，K-Means演算法中的聚類中心的個數k需要事先指定，這一點對於一些未知資料存

簡單易學的機器學習演算法——K-近鄰演算法

一、近鄰演算法(Nearest Neighbors) 1、近鄰演算法的概念近鄰演算法(Nearest Neighbors)是一種典型的非參模型，與生成方法(generalizing method)不同的是，在近鄰演算法中，通過以例項的形式儲存所有的訓練樣本，假

簡單易學的機器學習演算法——線性迴歸(1)

一、線性迴歸的概念對連續型資料做出預測屬於迴歸問題。舉個簡單的例子：例如我們在知道房屋面積(HouseArea)和臥室的數量(Bedrooms)的情況下要求房屋的價格(Price)。通過一組資料，我們得到了這樣的關係：

簡單易學的機器學習演算法——線性迴歸(2)

一、基本線性迴歸模型的抽象在基本的線性迴歸中(可見簡單易學的機器學習演算法——線性迴歸(1))，對於一個線性迴歸為題，我們得到一個線性方程組：

簡單易學的機器學習演算法——Logistic迴歸

一、Logistic迴歸的概述 Logistic迴歸是一種簡單的分類演算法，提到“迴歸”，很多人可能覺得與分類沒什麼關係，Logistic迴歸通過對資料分類邊界的擬合來實現分類。而“迴歸”也就意味著最佳擬合。要進行最佳擬

簡單易學的機器學習演算法——分類迴歸樹CART

引言分類迴歸樹（Classification and Regression Tree，CART）是一種典型的決策樹演算法，CART演算法不僅可以應用於分類問題，而且可以用於迴歸問題。

簡單易學的機器學習演算法——Softmax Regression

一、Softmax Regression簡介 Softmax Regression是Logistic迴歸的推廣，Logistic迴歸是處理二分類問題的，而SoftmaxRegression是處理多分類問題的。Logistic迴歸是處理二分類問題的比較好的演算法，具

簡單易學的機器學習演算法——Apriori演算法

一、關聯分析最初接觸到資料探勘的朋友肯定都聽說過這樣的一個案例：啤酒和尿布。大意是將啤酒和尿布放在一起的銷售會提高。其實這背後隱含的原理就是關聯分析，簡單來講就是啤酒和尿布之間存在著某種關聯關係

簡單易學的機器學習演算法——lasso

一、lasso 二、前向逐步迴歸前向逐步迴歸演算法可以得到與lasso差不多的效果，但是前向逐步迴歸更加簡單。這是一種貪心演算法，在每一步儘量減少誤差。

簡單易學的機器學習演算法——EM演算法

一、機器學習中的引數估計問題二、EM演算法簡介在上述存在隱變數的問題中，不能直接通過極大似然估計求出模型中的引數，EM演算法是一種解決存在隱含變數優化問題的有效方法。EM演算法是期望極大(Expectation

簡單易學的機器學習演算法——AdaBoost

一、整合方法(Ensemble Method) 整合方法主要包括Bagging和Boosting兩種方法，隨機森林演算法是基於Bagging思想的機器學習演算法，在Bagging方法中，主要通過對訓練資料集進行隨機取樣，以重新組合成不同的資料

簡單易學的機器學習演算法——Mean Shift聚類演算法

一、Mean Shift演算法概述 Mean Shift演算法，又稱為均值漂移演算法，Mean Shift的概念最早是由Fukunage在1975年提出的，在後來由Yizong Cheng對其進行擴充，主要提出了兩點的改進：

簡單易學的機器學習演算法——Metropolis-Hastings演算法

在簡單易學的機器學習演算法——馬爾可夫鏈蒙特卡羅方法MCMC中簡單介紹了馬爾可夫鏈蒙特卡羅MCMC方法的基本原理，介紹了Metropolis取樣演算法的基本過程，這一部分，主要介紹Metropolis-Hastings取樣演算法，Metropo

簡單易學的機器學習演算法——Gibbs取樣

一、Gibbs取樣概述前面介紹的Metropolis-Hastings取樣為從指定分佈中進行取樣提供了一個統一的框架，但是取樣的效率依賴於指定的分佈的選擇，若是選擇的不好，會使得接受率比較低，大量的取樣被拒絕，影響到整體的收

簡單易學的機器學習演算法——梯度提升決策樹GBDT

梯度提升決策樹（Gradient Boosting Decision Tree，GBDT）演算法是近年來被提及比較多的一個演算法，這主要得益於其演算法的效能，以及該演算法在各類資料探勘以及機器學習比賽中的卓越表現，有很多人對GBDT演算法進

簡單易學的機器學習演算法——因子分解機(Factorization Machine)

一、因子分解機FM的模型

1、因子分解機FM的優勢

2、因子分解機FM的模型

二、因子分解機FM演算法

三、因子分解機FM演算法的求解過程

1、交叉項係數

2、模型的求解

3、基於隨機梯度的方式求解

四、實驗(求解二分類問題)

1、實驗的程式碼：

2、實驗結果：

五、幾點疑問

參考文章

相關推薦