區域性線性嵌入(Locally Linear Embedding，以下簡稱LLE)也是非常重要的降維方法。和傳統的PCA，LDA等關注樣本方差的降維方法相比，LLE關注於降維時保持樣本區域性的線性特徵，由於LLE在降維時保持了樣本的區域性特徵，它廣泛的用於影象影象識別，高維資料視覺化等領域。下面我們就對LLE的原理做一個總結。

1. 流形學習概述

　　　　LLE屬於流形學習(Manifold Learning)的一種。因此我們首先看看什麼是流形學習。流形學習是一大類基於流形的框架。數學意義上的流形比較抽象，不過我們可以認為LLE中的流形是一個不閉合的曲面。這個流形曲面有資料分佈比較均勻，且比較稠密的特徵，有點像流水的味道。基於流行的降維演算法就是將流形從高維到低維的降維過程，在降維的過程中我們希望流形在高維的一些特徵可以得到保留。

　　　　一個形象的流形降維過程如下圖。我們有一塊捲起來的布，我們希望將其展開到一個二維平面，我們希望展開後的布能夠在區域性保持布結構的特徵，其實也就是將其展開的過程，就想兩個人將其拉開一樣。

　　　　在區域性保持布結構的特徵，或者說資料特徵的方法有很多種，不同的保持方法對應不同的流形演算法。比如等距對映（ISOMAP）演算法在降維後希望保持樣本之間的測地距離而不是歐式距離，因為測地距離更能反映樣本之間在流形中的真實距離。

　　　　但是等距對映演算法有一個問題就是他要找所有樣本全域性的最優解，當資料量很大，樣本維度很高時，計算非常的耗時，鑑於這個問題，LLE通過放棄所有樣本全域性最優的降維，只是通過保證區域性最優來降維。同時假設樣本集在區域性是滿足線性關係的，進一步減少的降維的計算量。

2. LLE思想

　　　　現在我們來看看LLE的演算法思想。

　　　　LLE首先假設資料在較小的區域性是線性的，也就是說，某一個數據可以由它鄰域中的幾個樣本來線性表示。比如我們有一個樣本x1,我們在它的原始高維鄰域裡用K-近鄰思想找到和它最近的三個樣本x2,x3,x4. 然後我們假設x1可以由x2,x3,x4線性表示，即：

x1=w12x2+w13x3+w14x4x1=w12x2+w13x3+w14x4

　　　　其中，w12，w13，w14為權重係數。在我們通過LLE降維後，我們希望x1在低維空間對應的投影x

′1x1′和x2,x3,x4x2,x3,x4對應的投影x′2,x′3,x′4x2′,x3′,x4′也儘量保持同樣的線性關係，即

x′1≈w12x′2+w13x′3+w14x′4x1′≈w12x2′+w13x3′+w14x4′

　　　　也就是說，投影前後線性關係的權重係數w12，w13，w14是儘量不變或者最小改變的。

　　　　從上面可以看出，線性關係只在樣本的附近起作用，離樣本遠的樣本對區域性的線性關係沒有影響，因此降維的複雜度降低了很多。

　　　　下面我們推導LLE演算法的過程。

3. LLE演算法推導

　　　　對於LLE演算法，我們首先要確定鄰域大小的選擇，即我們需要多少個鄰域樣本來線性表示某個樣本。假設這個值為k。我們可以通過和KNN一樣的思想通過距離度量比如歐式距離來選擇某樣本的k個最近鄰。

　　　　在尋找到某個樣本的

區域性線性嵌入(LLE)原理總結

1. 流形學習概述

2. LLE思想

3. LLE演算法推導

區域性線性嵌入(LLE)原理總結

用scikit-learn研究區域性線性嵌入(LLE)

LLE((locally linear embedding) 區域性線性嵌入演算法，一種降維方法

主成分分析(PCA)和區域性線性嵌入（LEE）原理詳解

LLE原理總結

降維演算法（LASSO、PCA、聚類分析、小波分析、線性判別分析、拉普拉斯特徵對映、區域性線性嵌入）

區域性線性嵌入降維演算法（含實驗程式碼）

線性判別分析LDA原理總結

『理論』科學計算專項_線性代數幾何原理剖析

Synchronized實現原理總結

orcFile split和讀數據原理總結（hive0.13）

CRC原理總結

Android - View繪圖原理總結

iOS底層原理總結 - 探尋block的本質（一）

《編譯原理總結》

受限玻爾茲曼機（RBM）原理總結

spark啟動原理總結

linux下DHCP服務原理總結

Kafka史上最詳細原理總結

特徵值法解常係數線性微分方程解法總結

區域性線性嵌入(LLE)原理總結

1. 流形學習概述

2. LLE思想

3. LLE演算法推導

相關推薦