1. 程式人生 > >因子分析理論介紹

因子分析理論介紹

因子分析分為Q型和R型,我們是正對R型進行如下研究:
一。因子分析步驟:
1.確認是是否適合做因子分析
2.構造因子變數
3.旋轉方法解釋
4.計算因子變數得分
二。因子分析的計算過程:
1.將原始資料標準化
目的:消除數量級量綱不同
2.求標準化資料的相關矩陣
3.求相關矩陣的特徵值和特徵向量
4.計算方差貢獻率和累計方差貢獻率
5.確定因子
F1,F2,F3...為前m個因子包含資料總量(累計貢獻率)不低於80%。可取前m各因子來反映原評價
6.因子旋轉
當所得因子不足以明顯確定或不易理解時選擇此方法
7.原指標的線性組合求各因子的得分
兩種方法:迴歸估計和barlett估計法
8.綜合得分:以各因子的方差貢獻率為權,各因子的線性組合得到各綜合評價指標函式

F=(λ1F1+…λmFm)/(λ1+…λm)

=W1F1+…WmFm

9.得分排序

--------------------------------------------------------------------------------------------------------------------------------------

想直接看結果的上面就是,沒什麼,下面就是我個人認為重要的,想學好因子分析要知道。

因子分析模型,又名正交因子模型

X=AF+ɛ

其中:

X=[X1,X2,X3...XP]‘


A=

F=[F1,F2...Fm]'

ɛ=[ɛ1,ɛ2...ɛp]'

以上滿足:

(1)m小於等於p

(2)cov(F,ɛ)=0

(3)Var(F)=Im

D(ɛ)=Var(ɛ)=

ɛ1,ɛ2...ɛp不相關,且方差不同

我們把F成為X公共因子,A為荷載矩陣,ɛ為X特殊因子

A=(aij)

數學上證明:aij就是i個變數與第j個因子的相關係數,參見層次分析法aij定義。


<1>荷載矩陣

就荷載矩陣的估計和解釋方法有主因子和極大似然估計,我們就主因子分析而言:(是主因子不是主成份)

設隨機向量X的協方差陣為Ʃ

λ1,λ2,λ3..>0為Ʃ的特徵根

μ1,μ2,μ3...為對應的標準正交向量

我們大一學過線代或者高代,裡面有個東西叫譜分析:

Ʃ=λ1μ1μ1’+......+λpμpμp’

=

當因子個數和變數個數一樣多,特殊因子方差為0.

此時,模型為X=AF,其中Var(F)=Ip

於是,Var(X)=Var(AF)=AVar(F)A'=AA'

對照Ʃ分解式,A第j列應該是也就是說,除了uj前面部分,第j列因子簽好為第j個主成份的係數,所以為主成份法。

如果非要作死考慮ɛ

原來的協方差陣可以分解為:

Ʃ=AA'+D=以上分析的目的;

1.因子分析模型是描述原變數X的協方差陣Ʃ的一種模型

2.主成份分析中每個主成份相應係數是唯一確定的,然而因子分析中的每個因子的相應係數不是唯一的,因而我們的因子荷載矩陣不是唯一的

(主成分分析是因子分析的特例,非常類似,有興趣的可以去看看,這兩者非常容易混淆)

<2>共同度和方差貢獻

無論是在spss或者R的因子分析中都圍繞著貢獻度,我們來看下,它到底是什麼意思。

由因子分析模型,當僅有一個公因子F時,

Var(Xi)=Var(aiF)+Var(ɛi)

由於資料標準化,左端為1,右端分別為共性方差和個性方差

共性方差越大,說明共性因子作用越大。

因子載荷矩陣A中的第i行元素之平方和記為hi2

成為變數(Xi)共同度

它是公共因子對(Xi)的方差鎖做出的貢獻,反映了全部公共因子對變數(Xi)的影響。

hi2大表明第i個分量對F的每一個分量F1,F2,...Fm的共同依賴程度大

將因子載荷矩陣A的第j列的各元素的平方和記為gj2

成為公共因子Fj對x的方差貢獻。

gj2表示第j個公共因子Fj對x的每一個分量Xi所提供的方差的總和,他就是衡量公共因子的相對重要行的指標。gj2越大,表明公共因子Fj對x的貢獻越大,或者說對x的影響和作用就越大。

如果將載荷矩陣A的所有gj2都計算出來,按大小排列,就可以提煉最有影響力的公共因子。

<3>因子旋轉

這方面涉及較為簡單,我就簡單提一下

目的:建立因子分析模型不是隻要找主因子,更加重要的是意義,以便對實際進行分析,因子旋轉就是使所得結論更加清晰的表示。

方法:正交旋轉,斜交旋轉兩大類,常用正交。

便於理解,我解釋下旋轉的意義,以平面直角座標系為例,我們想得到的資料正好為:y=x和y=-x上的點,我們能解釋的卻在x=0和y=0上,這時候我們就可以旋轉座標系,卻不影響結果。這只是便於理解,沒有任何科學依據,覺得不對的請無視。


如果有任何演算法、程式碼疑問都歡迎通過公眾號發訊息給我哦,已經給你們準備好資料大禮包了