ISOMAP演算法和MDS(mutiple dimensional scaling)多維縮放
阿新 • • 發佈:2018-12-25
文章根據 https://blog.csdn.net/Dark_Scope/article/details/53229427 而來。
MDS降維
- 降維演算法中,像PCA主成分分析的提供點座標進行降維的方法,還有一種是提供點之間距離就可完成降維的方法,那就是MDS。這種方法經常被用於流行學習中,例如經典的ISOMAP。
- 假設D為距離矩陣,X為降維後的樣本矩陣,
,想要只通過距離矩陣還原資料X是不太可能的,因為只給了距離資訊之後本身就丟掉了很多東西,但是是可以對資料進行降維的。而MDS的主要流程則是通過D得到B,再由B得到X,即D->B->X,D是距離矩陣,怎麼得到B呢?他們看起來好像沒有啥關係啊。-----因為MDS的目標是降維後資料之間的距離與原資料之間距離保持一致。即
,這樣他們之間就有關聯了。而
,那為什麼不能通過B還原原始資料呢?這是因為:
其中M是一組正交基,正交基與其轉置相乘為單位陣。
可以看出M對X做正交變換並不會影響B的值,而正交變換剛好就是對資料做旋轉、翻轉操作的。 所以如果我們想通過B反算出X,肯定是沒法得到真正的X,而是它的任意一種正交變換後的結果。 - D->B->X
通過平移所有點不會對距離矩陣造成影響,因此可以通過將資料平移到原點,即對資料做零均值化處理(也叫中心化),這樣可以得到矩陣元素之和相加為0的屬性,即:
因為 ,那麼對於B中的元素行和列和都為0,有:
類似:
這兩個性質對於該演算法來說十分重要,後面由D->B也與這兩個性質有較大關係。
設B的跡為T: