推薦系統ALS矩陣分解

阿新 • • 發佈：2018-12-29

矩陣分解模型的物理意義

技術分享

我們希望學習到一個P代表user的特徵，Q代表item的特徵。特徵的每一個維度代表一個隱性因子，比如對電影來說，這些隱性因子可能是導演，演員等。當然，這些隱性因子是機器學習到的，具體是什麼含義我們不確定。

學習到P和Q之後，我們就可以直接P乘以Q就可以預測所有user對item的評分了。

講完矩陣分解推薦模型，下面到als了（全稱Alternatingleast squares）。其實als就是上面損失函式最小化的一個求解方法，當然還有其他方法比如SGD等。

als論文中的損失函式是（跟上面那個稍微有點不同）

每次迭代，

固定M，逐個更新每個user的特徵u(對u求偏導，令偏導為0求解)。

固定U，逐個更新每個item的特徵m(對m求偏導，令偏導為0求解)。

論文中是這樣推導的

這是每次迭代求u的公式。求m的類似。

為了更清晰的理解，這裡結合spark的als程式碼講解。

spark原始碼中實現als有三個版本，一個是LocalALS.scala（沒有用spark），一個是SparkALS.scala（用了spark做並行優化），一個是mllib中的ALS。

本來LocalALS.scala和SparkALS.scala這個兩個實現是官方為了開發者學習使用spark展示的，

mllib中的ALS可以用於實際的推薦。

但是mllib中的ALS做了很多優化，不適合初學者研究來理解als演算法。

因此，下面我拿LocalALS.scala和SparkALS.scala來講解als演算法。

LocalALS.scala

    // Iteratively update movies then users
    for (iter <- 1 to ITERATIONS) {
      println(s"Iteration $iter:")
      ms = (0 until M).map(i => updateMovie(i, ms(i), us, R)).toArray  //固定使用者,逐個更新所有電影的特徵
      us = (0 until U).map(j => updateUser(j, us(j), ms, R)).toArray   //固定電影,逐個更新所有使用者的特徵
      println("RMSE = " + rmse(R, ms, us))
      println()
    }

  //更新第j個user的特徵向量
  def updateUser(j: Int, u: RealVector, ms: Array[RealVector], R: RealMatrix) : RealVector = {
    var XtX: RealMatrix = new Array2DRowRealMatrix(F, F) //F是隱性因子的數量
    var Xty: RealVector = new ArrayRealVector(F)
    // For each movie that the user rated 遍歷該user評分過的movie.顯然,這裡預設該使用者評分過所有電影,所以是0-M.實際應用求解,只需要遍歷該使用者評分過的電影.
    for (i <- 0 until M) {
      val m = ms(i)
      // Add m * m^t to XtX 外積後 累加到XtX
      XtX = XtX.add(m.outerProduct(m)) //向量與向量的外積:一個當作列向量,一個當作行向量,做矩陣乘法,結果是一個矩陣
      // Add m * rating to Xty
      Xty = Xty.add(m.mapMultiply(R.getEntry(i, j)))
    }
    // Add regularization coefficients to diagonal terms
    for (d <- 0 until F) {
      XtX.addToEntry(d, d, LAMBDA * M)
    }
    // Solve it with Cholesky 其實是解一個A*x=b的方程
    new CholeskyDecomposition(XtX).getSolver.solve(Xty)
  }

再結合論文中的公式

其實程式碼中的XtX就是公式中左邊紅圈的部分，Xty就是右邊紅圈的部分。

同理，更新每個電影的特徵m類似，這裡不再重複。

SparkALS.scala

    for (iter <- 1 to ITERATIONS) {
      println(s"Iteration $iter:")
      ms = sc.parallelize(0 until M, slices)
                .map(i => update(i, msb.value(i), usb.value, Rc.value))
                .collect()
      msb = sc.broadcast(ms) // Re-broadcast ms because it was updated
      us = sc.parallelize(0 until U, slices)
                .map(i => update(i, usb.value(i), msb.value, Rc.value.transpose()))
                .collect()
      usb = sc.broadcast(us) // Re-broadcast us because it was updated
      println("RMSE = " + rmse(R, ms, us))
      println()
    }

SparkALS版本相對於LocalALS的亮點時，做了並行優化。LocalALS中，每個user的特徵是序列更新的。而SparkALS中，是並行更新的。

參考資料：

《Large-scale Parallel Collaborative Filtering for the Netflix Prize》（als-wr原論文）

《Matrix Factorization Techniques for Recommender Systems》（矩陣分解模型的好材料）

推薦系統：矩陣分解與鄰域的融合模型

critical with 分析但是 rac 公式 download pearson 情況推薦系統通常分析過去的事務以建立用戶和產品之間的聯系，這種方法叫做協同過濾。協同過濾有兩種形式：隱語義模型（LFM），基於鄰域的模型（Neighborhood models）。

ALS矩陣分解演算法應用

1.原理問題描述 ALS的矩陣分解演算法常應用於推薦系統中，將使用者(user)對商品(item)的評分矩陣，分解為使用者對商品隱含特徵的偏好矩陣，和商品在隱含特徵上的對映矩陣。與傳統的矩陣分解SVD方法來分解矩陣R(R∈Rm×n)不同的是，ALS(a

深入理解Spark ML：基於ALS矩陣分解的協同過濾演算法與原始碼分析

1. 引言隨著網際網路的迅猛發展,為了滿足人們在繁多的資訊中獲取自己需要內容的需求,個性化推薦應用而生。協同過濾推薦是其中運用最為成功的技術之一。其中,基於使用者的最近鄰法根據相似使用者的評分來預測當前使用者的評分。然而,在使用者數量以及使用者評分不

推薦系統(recommender systems):預測電影評分--構造推薦系統的一種方法：低秩矩陣分解(low rank matrix factorization)

ngs img round col tin product ems 找到推薦如上圖中的predicted ratings矩陣可以分解成X與ΘT的乘積，這個叫做低秩矩陣分解。我們先學習出product的特征參數向量，在實際應用中這些學習出來的參數向量可能比較難以理解

技術乾貨丨想寫出人見人愛的推薦系統，先了解經典矩陣分解技術

網路中的資訊量呈現指數式增長，隨之帶來了資訊過載問題。推薦系統是大資料時代下應運而生的產物，目前已廣泛應用於電商、社交、短視訊等領域。本文將針對推薦系統中基於隱語義模型的矩陣分解技術來進行討論。 NO.1 評分矩陣、奇異值分解與Funk-SVD 對於一個推薦系統，其

推薦系統三十六式：矩陣分解學習筆記

作者：jliang https://blog.csdn.net/jliang3 1.重點歸納 1）評分預測問題只是很典型，其實並不大眾，畢竟在實際的應用中，評分資料很難收集到；與之相對的另一類問題是行為預測才是平民級推薦問題。在真正的推薦系統的實際應用中，評分

[吳恩達機器學習筆記]16推薦系統5-6協同過濾演算法/低秩矩陣分解/均值歸一化

16.推薦系統 Recommender System 覺得有用的話,歡迎一起討論相互學習~Follow Me 16.5 向量化：低秩矩陣分解Vectorization_ Low Rank M

淺談矩陣分解在推薦系統中的應用

推薦系統是當下越來越熱的一個研究問題，無論在學術界還是在工業界都有很多優秀的人才參與其中。近幾年舉辦的推薦系統比賽更是一次又一次地把推薦系統的研究推向了高潮，比如幾年前的Neflix百萬大獎賽，KDD CUP 2011的音樂推薦比賽，去年的百度電影推薦競賽，

矩陣分解在推薦系統的應用以及python程式碼的實現

矩陣分解在打分預估系統中得到了成熟的發展和應用，為了方便以後複習，先總結如下。打分矩陣R(n,m)是n行和m列，n表示user個數，m行表示item個數，例如R(5,6) item1item2item3item4item5item6 user1 544350 use

矩陣分解（MATRIX FACTORIZATION）在推薦系統中的應用

前言最近一段時間隱語義模型（Latent Factor Model，LFM）在推薦系統中的應用越來越廣泛，本文所介紹的矩陣分解方法也是基於這個隱語義模型。這裡需要說明的一點是，這裡所說的矩陣分解並不是SVD，之前在這個問題糾結了很久，因為網上很多人還有周圍的人都把矩

融合非負矩陣分解和圖全變分的歌曲推薦算法

算法摘要： Kirell Benzi, Vassilis Kalofolias, Xavier Bresson and Pierre Vandergheynst Signal Processing Laboratory 2 (LTS2), Swiss Federal Institute of Technolo

基於模型融合的推薦系統實現(2)：迭代式SVD分解

SVD演算法的原理網路上也有很多,不再細說了,關鍵是我們得到的資料是不完整的資料,所以要算SVD就必須做一次矩陣補全。補全的方式有很多,這裡推薦使用均值補全的方法(用每一行均值和每一列均值的平均來代替空白處)，然後可以計算SVD,作PCA分析,然後就可以得到預測結果。但是我們這裡有

機器學習：奇異值分解SVD簡介及其在推薦系統中的簡單應用

轉載自：https://www.cnblogs.com/lzllovesyl/p/5243370.html 本文先從幾何意義上對奇異值分解SVD進行簡單介紹，然後分析了特徵值分解與奇異值分解的區別與聯絡，最後用python實現將SVD應用於推薦系統。 1.SVD詳解 SVD(singul

推薦系統ALS矩陣分解

推薦系統ALS矩陣分解

推薦系統：矩陣分解與鄰域的融合模型

ALS矩陣分解演算法應用

深入理解Spark ML：基於ALS矩陣分解的協同過濾演算法與原始碼分析

推薦演算法——基於矩陣分解的推薦演算法

推薦系統(recommender systems):預測電影評分--構造推薦系統的一種方法：低秩矩陣分解(low rank matrix factorization)

推薦系統-矩陣分解

技術乾貨丨想寫出人見人愛的推薦系統，先了解經典矩陣分解技術

推薦系統三十六式：矩陣分解學習筆記

[吳恩達機器學習筆記]16推薦系統5-6協同過濾演算法/低秩矩陣分解/均值歸一化

推薦系統中的矩陣分解總結

淺談矩陣分解在推薦系統中的應用

矩陣分解在推薦系統的應用以及python程式碼的實現

推薦系統中的矩陣分解

矩陣分解（MATRIX FACTORIZATION）在推薦系統中的應用

推薦系統實踐 0x0b 矩陣分解

融合非負矩陣分解和圖全變分的歌曲推薦算法

推薦系統中的稀疏矩陣處理

基於模型融合的推薦系統實現(2)：迭代式SVD分解

機器學習：奇異值分解SVD簡介及其在推薦系統中的簡單應用

推薦系統ALS矩陣分解

相關推薦