主成分分析與逐步回歸分析的區別
阿新 • • 發佈:2019-01-19
多個 col 回歸分析 歸約 估計 降維 獨立 冗余 不完全
,當自變量間高度相關時,某些回歸參數的估計值極不穩定,甚至出現有悖常理、難以解釋的情形。這時,可先采用主成分分析產生若幹主成分,它們必定會將相關性較強的變量綜合在同一個主成分中,而不同的主成分又是互相獨立的。只要多保留幾個主成分,原變量的信息不致過多損失。然後,以這些主成分為自變量進行多重回歸就不會再出現共線性的困擾。如果原有p個自變量X1,X2,…,Xp,那麽,采用全部p個主成分所作回歸完全等價於直接對原變量的回歸;采用一部分主成分所作回歸雖不完全等價於對原變量的回歸,但往往能擺脫某些虛假信息,而出現較合理的結果。
以上思路也適用於判別分析,當自變量高度相關時,直接作判別分析同樣有多重共線性問題,可先計算自變量的主成分,然後通過主成分估計判別函數。如果變量不是很多可以直接回歸分析(step),剔除冗余的變量。
- 主成分分析:
- 變量的回歸分析(例如R中的update和step):
主成分分析與逐步回歸分析的區別