關於NMF（Non-negative Matrix Factorization ）

阿新 • • 發佈：2019-01-18

著名的科學雜誌《Nature》於1999年刊登了兩位科學家D.D.Lee和H.S.Seung對數學中非負矩陣研究的突出成果。該文提出了一種新的矩陣分解思想――非負矩陣分解(Non-negative Matrix Factorization，NMF)演算法，即NMF是在矩陣中所有元素均為非負數約束條件之下的矩陣分解方法。該論文的發表迅速引起了各個領域中的科學研究人員的重視：一方面，科學研究中的很多大規模資料的分析方法需要通過矩陣形式進行有效處理，而NMF思想則為人類處理大規模資料提供了一種新的途徑；另一方面，NMF分解演算法相較於傳統的一些演算法而言，具有實現上的簡便性、分解形式和分解結果上的可解釋性，以及佔用儲存空間少等諸多優點。
　　資訊時代使得人類面臨分析或處理各種大規模資料資訊的要求，如衛星傳回的大量影象、機器人接受到的實時視訊流、資料庫中的大規模文字、Web上的海量資訊等。處理這類資訊時，矩陣是人們最常用的數學表達方式，比如一幅影象就恰好與一個矩陣對應，矩陣中的每個位置存放著影象中一個畫素的空間位置和色彩資訊。由於實際問題中這樣的矩陣很龐大，其中存放的資訊分佈往往不均勻，因此直接處理這樣的矩陣效率低下，這對很多實際問題而言就失去了實用意義。為高效處理這些通過矩陣存放的資料，一個關鍵的必要步驟便是對矩陣進行分解操作。通過矩陣分解，一方面將描述問題的矩陣的維數進行削減，另一方面也可以對大量的資料進行壓縮和概括。

　　在科學文獻中，討論利用矩陣分解來解決實際問題的分析方法很多，如PCA(主成分分析)、ICA(獨立成分分析)、SVD(奇異值分解)、VQ(向量量化)等。在所有這些方法中，原始的大矩陣V被近似分解為低秩的V=WH形式。這些方法的共同特點是，因子W和H中的元素可為正或負，即使輸入的初始矩陣元素是全正的，傳統的秩削減演算法也不能保證原始資料的非負性。在數學上，從計算的觀點看，分解結果中存在負值是正確的，但負值元素在實際問題中往往是沒有意義的。例如影象資料中不可能有負值的畫素點；在文件統計中，負值也是無法解釋的。因此，探索矩陣的非負分解方法一直是很有意義的研究問題，正是如此，Lee和Seung兩位科學家的NMF方法才得到人們的如此關注。
　　NMF是一種新的矩陣分解演算法，它克服了傳統矩陣分解的很多問題，通過尋找上下文有意義的解決方法，提供解釋資料的更深看法。NMF通過尋找低秩，非負分解那些都為非負值的矩陣。這在現實的應用中有很多例子，如數字影象中的畫素一般為非負數，文字分析中的單詞統計也總是非負數，股票價格也總是正數等等。NMF的基本思想可以簡單描述為：對於任意給定的一個非負矩陣A，NMF演算法能夠尋找到一個非負矩陣U和一個非負矩陣V，使得滿足，從而將一個非負的矩陣分解為左右兩個非負矩陣的乘積。由於分解前後的矩陣中僅包含非負的元素，因此，原矩陣A中的一列向量可以解釋為對左矩陣U中所有列向量(稱為基向量)的加權和，而權重係數為右矩陣V中對應列向量中的元素。這種基於基向量組合的表示形式具有很直觀的語義解釋，它反映了人類思維中“區域性構成整體”的概念。研究指出，非負矩陣分解是個NP問題，可以劃為優化問題用迭代方法交替求解U和V。NMF演算法提供了基於簡單迭代的求解U，V的方法，求解方法具有收斂速度快、左右非負矩陣儲存空間小的特點，它能將高維的資料矩陣降維處理，適合處理大規模資料。利用NMF進行文字、影象大規模資料的分析方法，較傳統的處理演算法速度更快、更便捷。NMF思想的提出迅速得到了很多人的重視，並有很多將這種思想應用到實際中成功解決具體實際問題的例子。
　　非負矩陣的具體演算法如下：

　　輸入引數：Ｘ，Ｒ，MAXITER，其中Ｘ為被分解的矩陣，Ｒ為降階後Ｂ的秩，ＭＡＸＩＴＥＲ為迭代次數

　　輸出引數：Ｂ，Ｈ

　　１）：初始化矩陣Ｂ，Ｈ為非負數，同時對Ｂ的每一列資料歸一化

　　２）：for i=1:MAXITER

　　　　　ａ：更新Ｈ矩陣一行元素：H(i,j)=H(i,j)*(B'*X)(i,j)/(B'*B*H)(i,j)

　　　　　　ｂ：更新B的一列元素：B(k,j)=B(k,j)*(X*H')(k,j)/(B*H*H')(k,j);

c:重新對B進行列歸一化

3）end

matlab源程式如下：

dim=size(X);                                    %計算x的規格
X=double(X);
B=10*rand(dim(1),r);                            %初始化BH，為非負數
B=B./(ones(dim(1),1)*sum(B));                   %歸一化B的每一列

H=10*rand(r,dim(2));

maxiter=100;                                    %最大迭代次數
for iter=1:maxiter
    H=H.*(B'*(X./(B*H)));
    B=B.*((X./(B*H))*H');
    B=B./(ones(dim(1),1)*sum(B));
end

效果如下：

原始圖片分解後重構的圖片

參考文獻：

基於非負矩陣分解的人臉表情識別研究

非負矩陣分解：數學的奇妙力量

相片來自我大姨（攝於2005.02）

下一步嘗試採用NMF提取特徵。　　　　　

好文，轉自：http://fxy1211.blog.163.com/blog/static/68255322007826111015905/

關於NMF（Non-negative Matrix Factorization ）

關於NMF（Non-negative Matrix Factorization ）

Algorithms for Non-negative Matrix Factorization 非負矩陣分解

Bayesian non-negative matrix factorization核心過程推導

概率矩陣分解（Probabilistic Matrix Factorization）

矩陣分解（MATRIX FACTORIZATION）在推薦系統中的應用

【推薦演算法筆記二】矩陣因式分解（Matrix Factorization）

論文閱讀——矩陣填補模型之深度矩陣分解（Deep Matrix Factorization）

證明多項式複雜程度的非線性問題（Non-deterministic Completeness Problem）

吳恩達機器學習筆記59-向量化：低秩矩陣分解與均值歸一化（Vectorization: Low Rank Matrix Factorization & Mean Normalization）

LeetCode 59. Spiral Matrix II （螺旋矩陣之二）

UVA 1608 Non-boring sequences （分冶+遞歸）

博科300交換機不中斷（non-disruptive）固件升級

如何在Unity中開發Leap Motion桌面版（Non-VR）APP

HihoCoder1336 Matrix Sum（樹狀數組）

HDU - 6314 Matrix（廣義容斥原理）

LeetCode 240. 搜尋二維矩陣 II（Search a 2D Matrix II）

POJ 3422 - Kaka's Matrix Travels（最小費用流）

graph isomorphic（using adjacency matrix）

leet （Reshape the Matrix）

leetcode （Non-decreasing Array）

關於NMF（Non-negative Matrix Factorization ）

相關推薦