1. 程式人生 > >11種常見的多變數分析方法

11種常見的多變數分析方法

在社會科學研究中,主要的多變數分析方法包括多變數方差分析(Multivariate analysis of variance,MANOVA)、主成分分析(Principal component analysis)、因子分析(Factor analysis)、典型相關(Canonical correlation analysis)、聚類分析(Cluster analysis)、判別分析(Discriminant analysis)、多維量表分析(Multidimensional scaling),以及近來頗受矚目的驗證性因子分析(Confirmatory factor analysis )或線性結構模型(LISREL)與邏輯斯蒂迴歸分析等,以下簡單說明這些方法的觀念和適用時機。

 

多變數方差分析

MANOVA適用於同時探討一個或多個自變數與兩個以上因變數間因果關係的統計方法,依照研究者所操作自變數的個數,可以分為單因素(一個自變數)或多因素(兩個以上自變數)MANOVA。進行多變數方差分析時,自變數必須是離散的定類或定序變數,而因變數則必須是定距以上層次的變數。

 

主成分分析

主成分分析的主要功能在分析多個變數間的相關,以建構變數間的總體性指標(overall indicators)。當研究者測量一群彼此間具有高度相關的變數,則在進行顯著性檢驗錢,為避免變數數過多,造成解釋上的複雜與困擾,常會先進行主成分分析,在儘量不喪失原有資訊的前提下,抽取少數幾個主成分,作為代表原來變數的總體性指標,達到資料縮減(data reduction)的功能。進行主成分分析時,並無自變數和因變數的區別,但是所有的變數都必須是定距以上層次變數。

 

因子分析

因子分析與主成分分析常被研究者混用,因為二者的功能都是通過對變數間的相關分析,以達到簡化資料功能。但不同的是,主成分分析是在找出變數間最佳線性組合(linear combination)的主成分,以說明變數間最多的變異量;至於因子分析,則在於找出變數間共同的潛在結構(latent structure)或因子,以估計每一個變數在各因子上的負荷量(loading)。進行因子分析時,並無自變數和因變數的區分,但是所有變數都必須是定距以上層次變數。

 

典型相關

典型相關可視為積差相關或多元迴歸分析的擴充套件,主要功能在分析兩個變數間的相關。進行多元迴歸分析的目的,是在分析一個或多個自變數與一個因變數間的關係,而典型相關中因變數也可以是多個;也就是說,典型相關的目的在於通過計算得到兩個變數線性組合的加權係數。以使(maximum)兩個變數間的相關達到最大化。進行典型相關時,並無自變數和因變數的區分,但是所有變數都必須是定距以上層次變數。

 

5 聚類分析

聚類分析的主要功能在進行分類(classification),當研究者有觀測值時,常會根據觀測值的相似性或差異性進行分類,以形成幾個性質不同的類別,簡化解釋的工作。也就是說,聚類分析根據對變數進行測量的觀察值進行分類,以達到組內同質、組間異值的目的。其次,聚類分析完成後,通常可以進行判別分析,以識別分類的效度。當然,在某些時候也可以對變數進行分類(此功能類似因子分析,因此多采用因子分析解決問題)。進行聚類分析時,並無自變數和因變數的區分,但是所有變數都必須是定距以上層次變數。

 

判別分析

判別分析是多變數分析中應用相當廣泛的統計方法,它可以用來對樣本進行分類的工作;也可以用來了解不同類別樣本在某些變數上的差異情形;同時也可以根據不同類別的樣本在某些變數的實際表現,用來預測新的樣本屬於某一類別的概率。因此,在行為科學中,常見的研究者單獨使用判別分析,建立判別函式(discriminant function),以對新樣本進行預測;或是多變數方差分析的檢驗值達到顯著性水平後,比較不同組別樣本在因變數平均數的差異情形;或是聚類分析後,檢驗聚類分析的正確性。進行判別分析時,自變數是定距以上層次變數,至於因變數通常是離散變數。

 

多維量表分析

多維量表分析基本上也是一種分類的統計方法,他在市場上普遍被應用。當研究者想要解釋一群受試者(例如消費者)對一組客體(例如商品)在某些變數上相似性的測量中所包含的資訊,此時多維量表分析就是一個相當適用的方法。研究者只要將這一組客體在變數上的測量值轉化成多維度的幾何表徵,就能夠將這些客體有效地顯示在這個幾何空間中,達到分類的目的,同時也可以進一步解釋這些幾何表徵所代表的潛在結構或意義。進行多維量表分析時,並無自變數和因變數的區分,同時變數可以是等距以上變數,也可以是定類或定序變數。

 

線性結構方程

線性結構方程是一個相當具有變通與彈性的統計方法,隨著研究者對變數間關係界定的差異,LISREL的常見名稱包括協方差結構分析,潛變數分析、線性結構模型或驗證性因子分析。LISREL可視為多元迴歸分析與因子分析兩個方法論的整合模型,讓研究者可以探討變數間的線性關係(迴歸分析),並對可測量顯變數與不可測量的潛變數見(因子分析)的因果模型作假設檢驗。

 

邏輯斯蒂迴歸分析

邏輯斯蒂迴歸可視為傳統多元迴歸分析的一個特列。它和多元迴歸分析一樣,都具有解釋自變數與因變數之間的關係,並可進行預測。所不同的是在進行多元迴歸分析時,包括自變數與因變數都必須是定距以上層次變數;但在進行邏輯斯蒂迴歸分析時,自變數仍是定距以上層次變數,因變數則是二分的定類變數或多分定類變數或定序變數。

 

10 對數線性方程

在基本統計學中,當研究者面對探討兩個定類或定序變數間關係的研究問題時,都是以卡方檢驗來進行假設檢驗。當問題的性質是探討兩個定類變數間是否獨立或是關聯強度時,是以卡方獨立性檢驗來進行假設檢驗。進行卡方獨立性檢驗時,研究者必須將樣本在兩個定類變數上的反應,建立二維列聯表(contingency table),以進一步根據列聯表中各單元格(cell)的次數反應,進行顯著性檢驗。但當研究者面對三個或三個以上的定類變數時,所建立的多元列聯表間變數關聯的分析,卡方獨立性檢驗將無法解決這樣的問題,此時適合的方法就是對數線性模型。利用對數線性模型來解決多元列聯表的問題的目的,主要就在於探討構成列聯表的多個定類變數間的關係,進而在精簡原則下構建擬合的解釋模型,並根據所建立的模型估計單元格引數值,以瞭解各變數效果對單元格次數的影響。

 

11 Logit對數線性模型

在對數線性模型中,多個定類變數間是互為因果的關係(即相關關係),並無自變數與因變數的區分,研究目的在於探討變數間的關聯強度和性質。但有時研究者會面臨變數間有自變數和因變數的區分的情境。在基本統計學中,當研究者面對的問題性質是兩個定類變數間有自變數和因變數的區別,目的在於探討兩個變數間的因果關係時,多是以卡方齊性檢驗來進行假設檢驗。但自變數個數在兩個以上時,卡方齊性檢驗就不再適用,而必須改用logit對數線性模型方法來對資料進行分析。Logit對數線性模型的功能與多元迴歸分析相當類似,都可以用來探討與解釋因變數與自變數間的關係,但不同的是,多元迴歸分析的變數都是定距以上層次變數,通常以最小二乘法進行模型估計與檢驗;logit對數線性模型的變數都是定類變數,通常以最大似然估計法進行模型估計與檢驗。

 

·END·

轉載自:http://www.360doc.com/content/18/0309/10/52857582_735589820.shtml