【推薦演算法筆記二】矩陣因式分解（Matrix Factorization）

阿新 • • 發佈：2019-02-13

基於顯示反饋（explicit feedback）的推薦

將使用者的顯式反饋記錄，記錄在一個評分矩陣中：

矩陣中的數字代表使用者對物品的評分、？表示缺失值。如果我們能夠估計矩陣中每個?的值，我們就可以為每個使用者做推薦。

為什麼選擇矩陣因式分解（Matrix Factorization）?

Memory-based方法的侷限性：

非傳遞性（Non-transitivity）：如果兩個使用者的評分物品集沒有交集，既沒有都評分過的物品，那麼即使他們有相同的鄰居，他們也永遠不會被關聯起來。
低效率：必須要計算每一對使用者間的相似度，以及每一對物品間的相似度。

什麼是矩陣因式分解？

評分矩陣被分解為兩個小矩陣：

Uu· ∈ R1×d : 使用者u的特定潛在特徵向量，

Uu· 表示使用者u在d層面的興趣模型

Vi· ∈ R1×d : 物品i的特定潛在特徵向量，

Vi· 表示物品i在d層面的描述(description)

使用者u對物品i的整體偏好

符號表（notations）

n	使用者數量
m	物品數量
u ∈ {1, 2, . . . , n}	使用者id
i, i′ ∈ {1, 2, . . . ,m}	物品id
	觀測到的u對i的評分
	可選評分集合
	若u對i有評分則為1，否則為0
	訓練集中觀測到的評分記錄數量
μ	全域性平均評分
	使用者u的bias
	物品i的bias
	潛在特徵向量的維數
	權重引數
	使用者u對物品i的預測評分
T	演算法的迭代次數

概率矩陣分解PMF（Probabilistic Matrix Factorization）

預測公式（使用者u對物品i）：

目標函式：

其中的是需要被學習的模型引數。

梯度及更新公式

梯度更新使用隨機梯度下降演算法，對於任一隨機取樣的評分，我們有如下定義：

可得兩個特徵矩陣的梯度為：

因此更新公式（6-7）為：

（其中γ>0是學習率）

PMF的隨機梯度下降（SGD）演算法虛擬碼為：

正則化奇異值分解RSVD（Regularized Singular Value Decomposition）

在PMF的預測公式中，我們加入使用者bias、物品bias以及全域性評分均值μ

預測公式（使用者u對物品i）：

目標函式：

梯度及更新公式

梯度更新使用隨機梯度下降演算法，對於任一隨機取樣的評分，我們有如下定義：

可得各個引數的梯度為：

其中

因此更新公式（9-13）為：

模型引數初始化：

其中r為[0,1)區間內的隨機變數。

RSVD的隨機梯度下降（SGD）演算法虛擬碼為：

總結：矩陣因式分解的方法的目標函式是最小化預測值和真實值之間的誤差。也就是儘可能使訓練後模型計算出來的值能與可觀測到的真實值吻合，這樣在原矩陣中的？可以用模型計算而得的可靠的值替代。但是純粹使用矩陣的因式來還原評分矩陣可能並不那麼可靠，所以在預測時添加了使用者和物品的偏好以及全域性平均值來增加準確度。

本文內容來自W.K. Pan (CSSE, SZU)的課件

【推薦演算法筆記二】矩陣因式分解（Matrix Factorization）

基於顯示反饋（explicit feedback）的推薦將使用者的顯式反饋記錄，記錄在一個評分矩陣中：矩陣中的數字代表使用者對物品的評分、？表示缺失值。如果我們能夠估計矩陣中每個?的值，我們就可以為每個使用者做推薦。為什麼選擇矩陣因式分解（Matrix Factorizati

矩陣分解（MATRIX FACTORIZATION）在推薦系統中的應用

前言最近一段時間隱語義模型（Latent Factor Model，LFM）在推薦系統中的應用越來越廣泛，本文所介紹的矩陣分解方法也是基於這個隱語義模型。這裡需要說明的一點是，這裡所說的矩陣分解並不是SVD，之前在這個問題糾結了很久，因為網上很多人還有周圍的人都把矩

【opencv學習筆記二】opencv3.4.0元件結構說明

在學習opencv使用之前我們先來看一下opencv有哪些元件結構。至於OpenCV元件結構的研究方法，我們不妨管中窺豹，通過opencv安裝路徑下include目錄裡面標頭檔案的分類存放，來一窺OpenCV這些年迅猛發展起來的龐雜元件架構。我們進入到D:\ProgramFi

【canvas學習筆記二】繪製圖形

上一篇我們已經講述了canvas的基本用法，學會了構建canvas環境。現在我們就來學習繪製一些基本圖形。座標 canvas的座標原點在左上角，從左到右X軸座標增加，從上到下Y軸座標增加。座標的一個單元是1畫素。示意如下：矩形 canvas可以繪製的多邊形只有矩形，其他

【機器學習筆記14】奇異值分解(SVD)

奇異值分解定義: 假設A是一個m×nm \times nm×n的矩陣，則存在如下一種分解: Am×n=Um×m∑m×nVn×nTA_{m \times n}=U_{m \times m} \sum_{m \times n} V_{n \times n}^T

【打CF，學演算法——一星級】CodeForces 617D Polyline（水題）

There are three points marked on the coordinate plane. The goal is to make a simple polyline, without self-intersections and self-touches, such that it pa

【Robot定位學習筆記 1】GPS和IMU（慣導）在無人駕駛中的應用

無人駕駛定位技術行車定位是無人駕駛最核心的技術之一，全球定位系統（GPS）在無人駕駛定位中也擔負起相當重要的職責。然而無人車是在複雜的動態環境中行駛，尤其在大城市，GPS多路徑反射的問題會很明顯。這樣得到的GPS定位資訊很容易就有幾米的誤差。對於在有限寬度高速行駛的汽車來說，這樣的誤差很有可能

【打CF，學演算法——一星級】CodeForces 701A Cards（水題）

題面： A. Cards time limit per test 1 second memory limit per test 256 megabytes input standar

【微信H5開發】基於html2canvas實現（圖文組合）圖片長按即可儲存（簡單處理）

鑑於當前開發的功能比較簡單所以這裡只涉及html5的canvas來實現功能，所以沒有涉及很深的功能開發 <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <meta http-eq

[jzoj]5965. 【NOIP2018提高組D2T2】填數遊戲（推式子）

Problem 給定你一個 n ⋅ m

【深度學習數學基礎】向量點乘（內積）和叉乘（外積、向量積）概念及幾何意義解讀

1. 點乘向量的點乘,也叫向量的內積、數量積，對兩個向量執行點乘運算，就是對這兩個向量對應位一一相乘之後求和的操作，點乘的結果是一個標量。對於向量a和向量b：

【笨方法學PAT】1037 Magic Coupon （25 分）

一、題目 The magic shop in Mars is offering some magic coupons. Each coupon has an integer N printed on it, meaning that when you use this c

【笨方法學PAT】1059 Prime Factors （25 分）

一、題目 Given any positive integer N, you are supposed to find all of its prime factors, and write them in the format N = p1k

【笨方法學PAT】1051 Pop Sequence （25 分）

一、題目 Given a stack which can keep M numbers at most. Push N numbers in the order of 1, 2, 3, ..., N and pop randomly

【笨方法學PAT】1108 Finding Average （20 分）

一、題目 The basic task is simple: given N real numbers, you are supposed to calculate their average. But what makes it complicated is that

【笨方法學PAT】1112 Stucked Keyboard （20 分）

一、題目 On a broken keyboard, some of the keys are always stucked. So when you type some sentences, the characters corresponding to those keys will a

【笨方法學PAT】1122 Hamiltonian Cycle （25 分）

一、題目 The "Hamilton cycle problem" is to find a simple cycle that contains every vertex in a graph. Such a cycle is called a "Hamiltonian cycle".

【笨方法學PAT】1121 Damn Single （25 分）

一、題目 "Damn Single (單身狗)" is the Chinese nickname for someone who is being single. You are supposed to find those who are alone in a big party, so

【Yngz_Miao的部落格】部落格導航（不斷更新）

目前導航有初探Linux作業系統、STM32F103ZET6晶片、UCOS-III作業系統、Altium Designer四大塊。除此之外，部落格內還有包括C/C++程式語言、Qt5、TCP/IP、筆試題面經等方面的博文，可以在左側個人分類中查詢到。初探Linux作

演算法提高 8-1因式分解（c語言）

**問題描述　　設計演算法，使用者輸入合數，程式輸出若個素數的乘積。例如，輸入6，輸出23。輸入20，輸出22*5。**例：資料規模和約定　　輸入資料中每一個數在int表示範圍內。　法一：程式程式碼如下 #include<stdio.h> int isprime(

【推薦演算法筆記二】矩陣因式分解（Matrix Factorization）

基於顯示反饋（explicit feedback）的推薦

為什麼選擇矩陣因式分解（Matrix Factorization）?

什麼是矩陣因式分解？

符號表（notations）

概率矩陣分解PMF（Probabilistic Matrix Factorization）

梯度及更新公式

正則化奇異值分解RSVD（Regularized Singular Value Decomposition）

梯度及更新公式

相關推薦