因子得分因子分析綜合案例_第1頁
已閱讀1頁,還剩57頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、多元統(tǒng)計(jì)分析,第六章 因子分析 第二節(jié) 公共因子的導(dǎo)出 及因子旋轉(zhuǎn),第三節(jié) 因子得分 因子分析綜合案例,5、因子得分因子得分的概念 前面我們主要解決了用公共因子的線性組合來表示一組觀測(cè)變量的有關(guān)問題。如果我們要使用這些因子做其他的研究,比如把得到的因子作為自變量來做回歸分析,對(duì)樣本進(jìn)行分類或評(píng)價(jià),這就需要我們對(duì)公共因子進(jìn)行測(cè)度,即給出公共因子的值。,,例:人均要素變量因子分

2、析。對(duì)我國(guó)32個(gè)省市自治區(qū)的要素狀況作因子分析。指標(biāo)體系中有如下指標(biāo):X1 :人口(萬人) X2 :面積(萬平方公里)X3 :GDP(億元) X4 :人均水資源(立方米/人)X5:人均生物量(噸/人) X6:萬人擁有的大學(xué)生數(shù)(人)X7:萬人擁有科學(xué)家、工程師數(shù)(人),Rotated Factor Pattern FACTOR1 FACTOR2 FACTOR3 X1

3、-0.21522 -0.27397 0.89092 X2 0.63973 -0.28739 -0.28755 X3 -0.15791 0.06334 0.94855 X4 0.95898 -0.01501 -0.07556 X5 0.97224 -0.06778 -0.17535 X6 -0.11416 0.98328 -0.08300 X7

4、 -0.11041 0.97851 -0.07246,,X1=-0.21522F1-0.27397F2+0.89092F3 X2=0.63973F1-0.28739F2-0.28755F3 X3=-0.15791F1+0.06334F2+0.94855F3 X4=0.95898F1-0.01501F2-0.07556F3 X5=0.97224F1-0.06778F2-0.17535F3 X6=-0.

5、11416F1+0.98328F2-0.08300F3 X7=-0.11041F1+0.97851F2-0.07246F3,,,,Standardized Scoring Coefficients FACTOR1 FACTOR2 FACTOR3 X1 0.05764 -0.06098 0.50391 X2 0.22724 -0.09901 -0.07713 X3 0.

6、14635 0.12957 0.59715 X4 0.47920 0.11228 0.17062 X5 0.45583 0.07419 0.10129 X6 0.05416 0.48629 0.04099 X7 0.05790 0.48562 0.04822,F1=0.05764X1+0.22724X2+0.14635X3+0.47920X4+0.45583

7、X5+0.05416X6+0.05790X7F2=-0.06098X1-0.09901X2+0.12957X3+0.11228X4+0.07419X5+0.48629X6+0.48562X7F3=0.50391X1-0.07713X2+0.59715X3+0.17062X4+0.10129X5+0.04099X6+0.04822X7,,前三個(gè)因子得分,,因子分析的數(shù)學(xué)模型為: 原變量被表示為公共因子的線性組合,當(dāng)

8、載荷矩陣旋轉(zhuǎn)之后,公共因子可以做出解釋,通常的情況下,我們還想反過來把公共因子表示為原變量的線性組合。因子得分函數(shù):,,可見,要求得每個(gè)因子的得分,必須求得分函數(shù)的系數(shù),而由于p>m,所以不能得到精確的得分,只能通過估計(jì)。因子得分的計(jì)算方法:(1)運(yùn)用回歸分析思想求解(2) Bartlett(3)Anderson-rubin,,(1)運(yùn)用回歸分析思想求解,則,我們有如下的方程組:,j=1,2,…,m,注:共需要解m次才

9、能解出 所有的得分函數(shù)的系數(shù)。,,(2) Bartlett法(即:加權(quán)最小二乘法)把一個(gè)個(gè)體的p個(gè)變量的取值X*當(dāng)作因變量,把求因子解中得到的A作為自變量數(shù)據(jù)陣,對(duì)于這個(gè)個(gè)體在公因子上的取值f,當(dāng)作未知參數(shù),而特殊因子的取值看作誤差e,于是得到如下的線性回歸模型: x*=Af+e,則稱未知參數(shù)f為取值為X*的因子得分。,,最小二乘法,案例分析:,國(guó)民生活質(zhì)量的因素分析 國(guó)家發(fā)展的最終目標(biāo),是為了全面提高全體國(guó)民的生活質(zhì)量,

10、滿足廣大國(guó)民日益增長(zhǎng)的物質(zhì)和文化的合理需求。在可持續(xù)發(fā)展消費(fèi)的統(tǒng)一理念下,增加社會(huì)財(cái)富,創(chuàng)造更多的物質(zhì)文明和精神文明,保持人類的健康延續(xù)和生生不息,在人類與自然協(xié)同進(jìn)化的基礎(chǔ)上,維系人類與自然的平衡,達(dá)到完整的代際公平和區(qū)際公平(即時(shí)間過程的最大合理性與空間分布的最大合理化)。 從1990年開始,聯(lián)合國(guó)開發(fā)計(jì)劃署(UYNP)首次采用“人文發(fā)展系數(shù)”指標(biāo)對(duì)于國(guó)民生活質(zhì)量進(jìn)行測(cè)度。人文發(fā)展系數(shù)利用三類內(nèi)涵豐富的指標(biāo)組合,即人的健

11、康狀況(使用出生時(shí)的人均預(yù)期壽命表達(dá))、人的智力程度(使用組合的教育成就表達(dá))、人的福利水平(使用人均國(guó)民收入或人均GDP表達(dá))。,,在這個(gè)指標(biāo)體系中有如下的指標(biāo):X1——預(yù)期壽命X2——成人識(shí)字率X3——綜合入學(xué)率X4——人均GDP(美圓)X5——預(yù)期壽命指數(shù)X6——教育成就指數(shù)X7——人均GDP指數(shù),,旋轉(zhuǎn)后的因子結(jié)構(gòu) Rotated Factor Pattern

12、 FACTOR1 FACTOR2 FACTOR3 X1 0.38129 0.41765 0.81714 X2 0.12166 0.84828 0.45981 X3 0.64803 0.61822 0.22398

13、 X4 0.90410 0.20531 0.34100 X5 0.38854 0.43295 0.80848 X6 0.28207 0.85325 0.43289 X7 0.90091 0.20612 0.35052 FACTOR1為

14、經(jīng)濟(jì)發(fā)展因子 FACTOR2為教育成就因子 FACTOR3為健康水平因子,,被每個(gè)因子解釋的方差和共同度: Variance explained by each factor FACTOR1 FACTOR2 FACTOR3 2.439700 2.276317 2.009490 Final Commu

15、nality Estimates: Total = 6.725507 X1 X2 X3 X4 X5 0.987530 0.945796 0.852306 0.975830 0.992050 X6 X7 0.994995 0.976999,,Standardized Scoring Coefficients標(biāo)準(zhǔn)化得分系數(shù)

16、 FACTOR1 FACTOR2 FACTOR3 X1 -0.18875 -0.34397 0.85077 X2 -0.24109 0.60335 -0.10234 X3 0.35462 0.50232 -0.59895 X4 0.53990 -0.17336 -0.10355 X5

17、 -0.17918 -0.31604 0.81490 X6 -0.09230 0.62258 -0.24876,,生育率的影響因素分析 生育率受社會(huì)、經(jīng)濟(jì)、文化、計(jì)劃生育政策等很多因素影響,但這些因素對(duì)生育率的影響并不是完全獨(dú)立的,而是交織在一起,如果直接用選定的變量對(duì)生育率進(jìn)行多元回歸分析,最終結(jié)果往往只能保留兩三個(gè)變量,其他變量的信息就損失了。因此,考慮用因子分

18、析的方法,找出變量間的數(shù)據(jù)結(jié)構(gòu),在信息損失最少的情況下用新生成的因子對(duì)生育率進(jìn)行分析。 選擇的變量有:多子率、綜合節(jié)育率、初中以上文化程度比例、城鎮(zhèn)人口比例、人均國(guó)民收入。下表是1990年中國(guó)30個(gè)省、自治區(qū)、直轄市的數(shù)據(jù)。,特征根與各因子的貢獻(xiàn),沒有旋轉(zhuǎn)的因子結(jié)構(gòu),,,在這個(gè)例子中我們得到了兩個(gè)因子,第一個(gè)因子是社會(huì)經(jīng)濟(jì)發(fā)展水平因子,第二個(gè)是計(jì)劃生育因子。有了因子得分值后,則可以利用因子得分為變量,進(jìn)行其他的統(tǒng)計(jì)分析

19、。,方差最大旋轉(zhuǎn)后的因子結(jié)構(gòu),標(biāo)準(zhǔn)化得分函數(shù),6.3 因子分析的上機(jī)操作,,,,(01)建立數(shù)據(jù)文件,,,(02)選擇分析變量 ——選SPSS [Analyze]菜單中的(Data Reduction)→(Factor),出現(xiàn)【 Factor Analysis】對(duì)話框;——在【 Factor Analysis】對(duì)話框中左邊的原始變量中,選擇將進(jìn)行因子分析的變量選入(Variables)欄。,,,,(03)設(shè)置描述性統(tǒng)計(jì)量——在【

20、 Factor Analysis】框中選【 Descriptives】按鈕,出現(xiàn)【 Descriptives 】對(duì)話框;——選擇 Initial solution (未轉(zhuǎn)軸的統(tǒng)計(jì)量)選項(xiàng)——選擇KMO 選項(xiàng)——點(diǎn)擊(Contiue)按鈕確定。,,,,SPSS 主要計(jì)算結(jié)果,,,(04)設(shè)置對(duì)因子的抽取選項(xiàng) ——在【 Factor Analysis】框中點(diǎn)擊【Extraction】按鈕,出現(xiàn)【 Factor Analysis:E

21、xtraction】對(duì)話框;——在Method 欄中選擇(Principal components)選項(xiàng);——在Analyze 欄中選擇Correlation matrix選項(xiàng);——在Display 欄中選擇Unrotated factor solution選項(xiàng);——在Extract 欄中選擇Eigenvalues over 并填上 1 ;——點(diǎn)擊(Contiue)按鈕確定,回到【 Factor Analysis】對(duì)話框中。

22、,,,,,,,,,(05)設(shè)置因子轉(zhuǎn)軸—— 在【 Factor Analysis】對(duì)話框中,點(diǎn)擊【Rotation】按鈕,出現(xiàn) 【 Factor Analysis:Rotation 】(因子分析:旋轉(zhuǎn))對(duì)話框。 —— 在Method 欄中選擇 Varimax(最大變異法) —— 在Display欄中選擇 Rotated solution(轉(zhuǎn)軸后的解) —— 點(diǎn)擊(Contiue)按鈕確定,回到【 Factor Analysi

23、s】對(duì)話框中。,,,,,,(06)設(shè)置因素分?jǐn)?shù)—— 在【 Factor Analysis】對(duì)話框中,點(diǎn)擊【Scores】按鈕,出現(xiàn) 【 Factor Analysis: Scores 】(因素分析:分?jǐn)?shù))對(duì)話框。 —— 一般取默認(rèn)值。 —— 點(diǎn)擊(Contiue)按鈕確定,回到【 Factor Analysis】對(duì)話框。,,,,,,,(07)設(shè)置因子分析的選項(xiàng)——在【 Factor Analysis】對(duì)話框中,單擊【Optio

24、ns】按鈕,出現(xiàn) 【 Factor Analysis:Options 】(因素分析:選項(xiàng))對(duì)話框?!贛issing Values 欄中選擇Exclude cases listwise(完全排除缺失值)——在Coefficient Display Format(系數(shù)顯示格式)欄中選擇Sorted by size(依據(jù)因素負(fù)荷量排序)項(xiàng);——在Coefficient Display Format(系數(shù)顯示格式)勾選“Suppres

25、s absolute values less than”,其后空格內(nèi)的數(shù)字不用修改,默認(rèn)為0.1?!绻芯空咭尸F(xiàn)所有因素負(fù)荷量,就不用選取“Suppress absolute values less than”選項(xiàng)。在例題中為了讓研究者明白此項(xiàng)的意義,才勾選了此項(xiàng),正式的研究中應(yīng)呈現(xiàn)題項(xiàng)完整的因素負(fù)荷量較為適宜?!獑螕簟癈ontinue”按鈕確定。,,,,,,對(duì)SPSS因子分析結(jié)果的解釋,取樣適當(dāng)性(KMO)檢驗(yàn)—— KM

26、O值越大,表示變量間的共同因素越多,越適合進(jìn)行因素分析,要求KMO>0.5—— 要求Barlett’s的卡方值達(dá)到顯著程度,,,2.共同度檢查,,,3.因子陡坡檢查,除去坡線平坦部分的因子圖中第三個(gè)因子以后較為平坦,故保留3個(gè)因子,,,4.方差貢獻(xiàn)率檢驗(yàn) ——取特征值大于 1 的因子,共有3 個(gè),分別(6.358)(1.547)(1.032); ——變異量分別為(63.58%)(15.467%)(10.32%),,,

27、5.顯示未轉(zhuǎn)軸的因子矩陣,,,6. 分析轉(zhuǎn)軸后的因子矩陣----根據(jù)因子負(fù)荷量形成3個(gè)公共因子,,,形成綜合分析結(jié)果,,例1:對(duì)美國(guó)洛杉磯12個(gè)人口調(diào)查區(qū)的5個(gè)經(jīng)濟(jì)學(xué)變量的數(shù)據(jù)進(jìn)行因子分析(12個(gè)地區(qū)調(diào)查表.sav)菜單:Analyze-Data Reduction-FactorVariables :pop,School,employ,Services, house其他使用默認(rèn)值(主成分分析法Principal componen

28、ts,選取特征值>1,不旋轉(zhuǎn)),,輸出結(jié)果:,,比較有用的結(jié)果:兩個(gè)主成分(因子)f1,f2及因子載荷矩陣(Component Matrix),根據(jù)該表可以寫出每個(gè)原始變量(標(biāo)準(zhǔn)化值)的因子表達(dá)式: Pop?0.581f1 + 0.806f2 School ? 0.767f1 - 0.545f2 employ ? 0.672f1 + 0.726f2 Services ? 0.932f1

29、- 0.104f2 house ? 0.791f1 - 0.558f2每個(gè)原始變量都可以是5個(gè)因子的線性組合,提取兩個(gè)因子f1和f2,可以概括原始變量所包含信息的93.4%。 f1和f2前的系數(shù)表示該因子對(duì)變量的影響程度,也稱為變量在因子上的載荷。但每個(gè)因子(主成分)的系數(shù)(載荷)沒有很明顯的差別,所以不好命名。因此為了對(duì)因子進(jìn)行命名,可以進(jìn)行旋轉(zhuǎn),使系數(shù)向0和1兩極分化。,,由于系數(shù)沒有很明顯的差別,所以要進(jìn)行旋轉(zhuǎn)(Ro

30、tation:method一般用Varimax方差最大旋轉(zhuǎn)),使系數(shù)向0和1兩極分化菜單:Analyze-Data Reduction-FactorVariables :pop,School,employ,Services, houseExtraction:使用默認(rèn)值( method:Principal components,選取特征值>1)Rotation:method選VarimaxScore:Save as var

31、iables 和Display factor score Coefficient matrix,輸出結(jié)果: (表1-3同前),旋轉(zhuǎn)后的因子載荷矩陣:,因子旋轉(zhuǎn)中的正交矩陣:,因子得分系數(shù)矩陣:,因子得分協(xié)方差矩陣:,,比較有用的結(jié)果:兩個(gè)主成分(因子)f1,f2及旋轉(zhuǎn)后的因子載荷矩陣(Rotated Component Matrix) ,根據(jù)該表可以寫出每個(gè)原始變量(標(biāo)準(zhǔn)化值)的因子表達(dá)式: Pop? 0.01602 f1 +

32、 0.9946f2 School ? 0 .941f1 - 0.00882f2 employ ? 0.137f1 + 0.98f2 Services ? 0.825f1 +0.447f2 house ? 0.968f1 - 0.00605f2F1= 0.01602 Pop+ 0 .941 School+ 0.137 employ+ 0.825 Services+ 0.968 houseF2=

33、 0.9946 Pop-0.00882 School+ 0.98 employ+ 0.447 Services-0.00605 house第一主因子對(duì)中等學(xué)校平均校齡,專業(yè)服務(wù)項(xiàng)目,中等房?jī)r(jià)有絕對(duì)值較大的載荷(代表一般社會(huì)福利-福利條件因子); 而第二主因子對(duì)總?cè)丝诤涂偣蛦T數(shù)有較大的載荷(代表人口-人口因子).,比較有用的結(jié)果:因子得分fac1_1, fac2_1。其計(jì)算公式:因子得分系數(shù)和原始變量的標(biāo)準(zhǔn)化值的乘積之和。fac1_

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論