薛薇-《spss統(tǒng)計分析方法及應用》第八章--相關分析和線性回歸分析_第1頁
已閱讀1頁,還剩109頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第八章 相關分析和線性回歸分析,,,SPSS的相關分析與回歸分析,8.1 相關分析和回歸分析概述8.2 相關分析8.3 偏相關分析8.4 線性回歸分析 (重點)8.5 曲線估計,8.1 相關分析和回歸分析概述,客觀事物之間的關系大致可歸納為兩大類:函數(shù)關系(確定性關系) :指兩事物之間的一種一一對應的關系,如商品的銷售額和銷售量之間的關系。統(tǒng)計關系(非確定性關系):指兩事物之間的一種非一一對應的關系,例如家庭收入和支出、子

2、女身高和父母身高之間的關系等。統(tǒng)計關系又分為相關關系和回歸關系兩種。相關分析和回歸分析都是分析客觀事物之間統(tǒng)計關系的數(shù)量分析方法。,相關分析與回歸分析的區(qū)別,8.2 相關分析,8.2.1 散點圖8.2.2 相關系數(shù)8.2.3 基本操作8.2.4 應用舉例,相關分析通過圖形和數(shù)值兩種方式,有效地揭示事物之間相關關系的強弱程度和形式。8.2.1 散點圖 它將數(shù)據(jù)以點的的形式畫在直角坐標系上,通過觀察散點圖能夠直觀的

3、發(fā)現(xiàn)變量間的相關關系及他們的強弱程度和方向。,散點圖的繪制,單擊圖形?舊對話框?散點/點狀,打開窗口,簡單分布(Simple Scatter),只能在圖上顯示一對相關變量矩陣分布(Matrix Scatter),在矩陣中顯示多個相關變量重疊分布(Overlay Scatter),在圖上顯示多對相關變量3-D分布(3-D Scatter),顯示三個相關變量簡單點,堆積散點圖,1、簡單散點圖 選中簡單分布,單擊定義Define按

4、鈕,打開窗口,相關回歸分析(高校科研研究).sav,Y軸Y Axis:選擇Y軸要繪制的變量X軸X Axis:選擇X軸要繪制的變量設置標記Set Markers by:選擇分組變量,SPSS根據(jù)該變量的值將觀測量分成幾組,每組采用不同的符號標注標注個案Label Cases by:觀測量標簽變量,2、矩陣散點圖在矩陣散點圖中,將圖形分成多個方格,在每個方格中單獨繪制某兩個變量的數(shù)據(jù)。在散點圖窗口中選擇矩陣散點圖,單擊定義Defi

5、ne,在出現(xiàn)的窗口中,依次選擇投入高級職稱人數(shù)、課題總數(shù)、論文數(shù)和獲獎數(shù)進入矩陣變量Matrix框中,選擇是否為直轄市進入設置標記Set Markers框中。,相關回歸分析(高??蒲醒芯浚?sav,3、重疊散點圖 在重疊散點圖中,在一個坐標系中繪制多個不同的變量對。 在散點圖窗口中選擇重疊散點圖,單擊定義Define,在出現(xiàn)的窗口中,選擇變量投入人年數(shù)--論文數(shù)對和投入高級職稱的人年數(shù)--專著數(shù)對進入Y-X

6、Pairs框中。,相關回歸分析(高??蒲醒芯浚?sav,4、三維散點圖 三維散點圖在三維坐標系中繪制三個變量的數(shù)據(jù)。 在散點圖窗口中選擇三維散點圖,單擊Define,在出現(xiàn)的窗口中,分別選擇論文數(shù)、投入人年數(shù)和獲獎數(shù)為Y軸變量、X軸變量、Z軸變量。,相關回歸分析(高校科研研究).sav,5、堆積散點圖-簡單點圖,選中簡單點,單擊定義Define按鈕,打開窗口,相關回歸分析(高??蒲醒芯浚?sav,對于其它圖形的S

7、PSS繪制,可閱讀參考書,杜強、賈麗艷,《SPSS統(tǒng)計分析從入門到精通》,人民郵電出版社,2011年書中的第19章,統(tǒng)計圖形.,8.2.2 相關系數(shù),利用相關系數(shù)進行變量間線性關系的分析通常需要完成以下兩個步驟:第一,計算樣本相關系數(shù)r;相關系數(shù)r的取值在-1~+1之間r>0,正的線性相關關系;r0.8,較強的線性關系; |r|<0.3,線性關系較弱第二,對樣本來自的兩總體是否存在顯著的線性關系進行推斷。,雙變

8、量關系強度測量的主要指標,對不同類型的變量應采用不同的相關系數(shù)來度量,適用于兩分類變量的分析,適用于一分類變量一定距變量的分析,適用于兩順序變量的分析,更多指標-交叉列聯(lián)表,1. Pearson簡單相關系數(shù),適用于兩個變量都是數(shù)值型的數(shù)據(jù)Pearson簡單相關系數(shù)的檢驗統(tǒng)計量為:,2. Spearman等級相關系數(shù),用來度量兩定序變量間的線性相關關系,計算時并不直接采用原始數(shù)據(jù) ,而是利用數(shù)據(jù)的秩,用兩變

9、量的秩 代替 代入Pearson簡單相關系數(shù)計算公式中,于是其中的 和 的取值范圍被限制在1和n之間,且可被簡化為:,如果兩變量的正相關性較強,它們秩的變化具有同步性,于是 的值較小,r趨向于1;如果兩變量的正相關性較弱,它們秩的變化不具有同步性,于是 的值較大,r趨向于0;在小樣

10、本下,在零假設成立時, Spearman等級相關系數(shù)服從Spearman分布;在大樣本下, Spearman等級相關系數(shù)的檢驗統(tǒng)計量為Z統(tǒng)計量,定義為: Z統(tǒng)計量近似服從標準正態(tài)分布。,,3. Kendall 相關系數(shù),用非參數(shù)檢驗方法來度量兩定序變量間的線性相關關系, 利用變量秩數(shù)據(jù)計算一致對數(shù)目(U)和非一致對數(shù)目(V)。U較大,V較小,較強正相關;U較小,V較大,較強負相關;U和V大致相當,各占樣本數(shù)

11、的1/2,相關性較弱.,. Kendall 統(tǒng)計量的數(shù)學定義小樣本下服從Kendall分布, 大樣本下采用的檢驗統(tǒng)計量為,8.2.3 基本操作,相關分析用于描述兩個變量間 關系的密切程度,其特點是 變量不分主次,被置于同等的地位。在分析Analyze的下拉菜單相關Correlate命令項中有三個相關分析功能子命令雙變量Bivariate、偏相關Partial、 距離Distances,分別對應著相關分析、

12、偏相關分析和相似性測度(距離)的三個SPSS過程。,Bivariate過程用于進行兩個或多個變量間的相關分析,如為多個變量,給出兩兩相關的分析結果。Partial過程,當進行相關分析的兩個變量的取值都受到其他變量的影響時,就可以利用偏相關分析對其他變量進行控制,輸出控制其他變量影響后的偏相關系數(shù)。Distances過程用于對各樣本點之間或各個變量之間進行相似性分析,一般不單獨使用,而作為聚類分析和因子分析等的預分析。,Bivaria

13、te相關分析步驟,1) 選擇菜單Analyze ?Correlate ?Bivariate,出現(xiàn)窗口:,2) 把要分析的變量選到變量Variables框。3) 在相關系數(shù)Correlation Coefficents框中選擇計算哪種相關系數(shù)。4) 在顯著性檢驗Test of Significance框中選擇輸出相關系數(shù)檢驗的雙邊(Two-Tailed)概率p值或單邊(One-Tailed)概率p值。5)選中標記顯著性相關Flag

14、significance correlation選項表示分析結果中除顯示p值外,還輸出星號標記,以標明變量間的相關性是否顯著;不選中則不輸出星號標記。,6) 在選項Option按鈕中的統(tǒng)計Statistics選項中,選中Cross-product deviations and covariances表示輸出兩變量的離差平方和協(xié)方差。,8.2.4 應用舉例,為研究高等院校人文社會科學研究中立項課題數(shù)會受哪些因素的影響,收集1999年31個

15、省市自治區(qū)部分高校有關社科研究方面的數(shù)據(jù),研究立項課題數(shù)(當年)與投入的具有高級職稱的人年數(shù)(當年)、發(fā)表的論文數(shù)(上年)之間是否具有較強的線性關系。 對該問題的研究可以采用相關分析的方法,首先可繪制矩陣散點圖;其次可以計算Pearson簡單相關系數(shù)。,相關回歸分析(高??蒲醒芯浚?sav,輸出結果,8.3 偏相關分析,8.3.1 偏相關分析和偏相關系數(shù)8.3.2 基本操作8.3.3 應用舉例,8.3.1 偏相關分

16、析和偏相關系數(shù),上節(jié)中的相關系數(shù)是研究兩變量間線性相關性的,若還存在其他因素影響,就相關系數(shù)本身來講,它未必是兩變量間線性相關強弱的真實體現(xiàn),往往有夸大的趨勢。例如,在研究商品的需求量和價格、消費者收入之間的線性關系時,需求量和價格之間的相關關系實際還包含了消費者收入對價格和商品需求量的影響。,偏相關分析也稱凈相關分析,它在控制其他變量的線性影響的條件下分析兩變量間的線性關系,所采用的工具是偏相關系數(shù)。控制變量個數(shù)為1時,偏相關系數(shù)

17、稱一階偏相關;當控制兩個變量時,偏相關系數(shù)稱為二階偏相關;當控制變量的個數(shù)為0時,偏相關系數(shù)稱為零階偏相關,也就是簡單相關系數(shù)。,利用偏相關系數(shù)進行分析的步驟,第一,計算樣本的偏相關系數(shù)假設有三個變量y、x1和x2,在分析x1和y之間的凈相關時,當控制了x2的線性作用后,x1和y之間的一階偏相關定義為:偏相關系數(shù)的取值范圍及大小含義與相關系數(shù)相同.,第二,對樣本來自的兩總體是否存在顯著的凈相關進行推斷檢驗統(tǒng)計量為:其

18、中,r為偏相關系數(shù),n為樣本數(shù),q為階數(shù)。T統(tǒng)計量服從n-q-2個自由度的t分布。,8.3.2 基本操作,1) 選擇菜單Analyze ?Correlate ?Partial,相關回歸分析(高校科研研究).sav,2) 把參與分析的變量選擇到Variables框中。3) 選擇一個或多個控制變量到Controlling for框中。4) 在Test of Significance框中選擇輸出偏相關檢驗的雙尾概率p值或單尾概率p值。5

19、) 在Option按鈕中的Statistics選項中,選中Zero-order Correlations表示輸出零階偏相關系數(shù)。至此,SPSS將自動進行偏相關分析和統(tǒng)計檢驗,并將結果顯示到輸出窗口。,8.3.3 應用舉例,上節(jié)中研究高校立項課題總數(shù)影響因素的相關分析中發(fā)現(xiàn),發(fā)現(xiàn)立項課題數(shù)與論文數(shù)之間有較強正線性相關關系,但應看到這種關系中可能摻入了投入高級職稱的人年數(shù)的影響,因此,為研究立項課題總數(shù)和發(fā)表論文數(shù)之間的凈相關系數(shù),可以將

20、投入高級職稱的人年數(shù)加以控制,進行偏相關分析。,相關回歸分析(高??蒲醒芯浚?sav,輸出結果,相關分析輸出結果;正強相關,偏相關分析輸出結果;負的弱相關,8.4 回歸分析,8.4.1 回歸分析概述8.4.2 線性回歸模型8.4.3 回歸方程的統(tǒng)計檢驗8.4.4 基本操作8.4.5 其它操作8.4.6 應用舉例,8.4.1 線性回歸分析概述,線性回歸分析的內容能否找到一個線性組合來說明一組自變量和因變量的關系如果能的話,

21、這種關系的強度有多大,也就是利用自變量的線性組合來預測因變量的能力有多強整體解釋能力是否具有統(tǒng)計上的顯著性在整體解釋能力顯著的情況下,哪些自變量有顯著意義,回歸分析的一般步驟確定回歸方程中的解釋變量(自變量)和被解釋變量(因變量)確定回歸方程對回歸方程進行各種檢驗利用回歸方程進行預測,8.4.2 線性回歸模型,一元線性回歸模型的數(shù)學模型: 其中x為自變量;y為因變量; 為截距,即常量; 為回歸系數(shù)

22、,表明自變量對因變量的影響程度。,用最小二乘法求解方程中的兩個參數(shù),得到,多元線性回歸模型,多元線性回歸方程: y=β0+β1x1+β2x2+...+βkxkβ1、β2、βk為偏回歸系數(shù)。β1表示在其他自變量保持不變的情況下,自變量x1變動一個單位所引起的因變量y的平均變動。,多元線性回歸的估計,1. 回歸方程的擬合優(yōu)度回歸直線與各觀測點的接近程度稱為回歸方程的擬合優(yōu)度,即樣本觀測值聚集在回歸線周圍的緊密程度 。1)離

23、差平方和的分解: 建立直線回歸方程可知:y的觀測值的總變動可由 來反映,稱為總變差。引起總變差的原因有兩個:(a)由于x的取值不同,使得與x有線性關系的y值不同;(b)隨機因素的影響。,8.4.3 線性回歸方程的統(tǒng)計檢驗,總離差平方和可分解為,即:總離差平方和(SST)=剩余離差平方和(SSE) +回歸離差平方和(SSR) 其中;SSR

24、是由x和y的直線回歸關系引起的,可以由回歸直線做出解釋;SSE是除了x對y的線性影響之外的隨機因素所引起的Y的變動,是回歸直線所不能解釋的。,2、可決系數(shù)(判定系數(shù)、決定系數(shù)),回歸平方和在總離差平方和中所占的比例可以作為一個統(tǒng)計指標,用來衡量X與Y 的關系密切程度以及回歸直線的代表性好壞,稱為可決系數(shù)。對于一元線性回歸方程:,對于多元線性回歸方程:在多元線性回歸分析中,引起判定系數(shù)增加的原因有兩個:一個是方程中的解釋變量個數(shù)

25、增多,另一個是方程中引入了對被解釋變量有重要影響的解釋變量。在多元線性回歸分析中,調整的判定系數(shù)比判定系數(shù)更能準確的反映回歸方程的擬合優(yōu)度。,2. 回歸方程的顯著性檢驗(方差分析F檢驗),回歸方程的顯著性檢驗是要檢驗被解釋變量與所有的解釋變量之間的線性關系是否顯著。對于一元線性回歸方程,檢驗統(tǒng)計量為:對于多元線性回歸方程,檢驗統(tǒng)計量為:,3. 回歸系數(shù)的顯著性檢驗(t檢驗),回歸系數(shù)的顯著性檢驗是要檢驗回歸方程中被解釋變量與每

26、一個解釋變量之間的線性關系是否顯著。對于一元線性回歸方程,檢驗統(tǒng)計量為:,對于多元線性回歸方程,檢驗統(tǒng)計量為:,線性回歸模型的假設條件,滿足Gauss-Markov條件(即等方差與不相關假定):正態(tài)分布假定條件:各自變量序列之間不相關:,,,,,,多重共線性,自相關,異方差,4. 殘差分析,殘差是指由回歸方程計算得到的預測值與實際樣本值之間的差距,定義為: 對于線性回歸分析來講,如果方程能夠較好的反映被解釋變

27、量的特征和規(guī)律性,那么殘差序列中應不包含明顯的規(guī)律性。殘差分析包括以下內容:殘差服從正態(tài)分布,其平均值等于0;殘差取值與X的取值無關;殘差不存在自相關;殘差方差相等。,異方差的檢驗與處理,1) 對于殘差均值和方差齊性檢驗可以利用殘差圖進行分析。如果殘差均值為零,殘差圖的點應該在縱坐標為0的中心的帶狀區(qū)域中隨機散落。如果殘差的方差隨著解釋變量值(或被解釋變量值)的增加呈有規(guī)律的變化趨勢,則出現(xiàn)了異方差現(xiàn)象。,2) Spearman(斯皮爾

28、曼)檢驗,即等級相關系數(shù)檢驗建模時不能消除數(shù)據(jù)的異方差,只能消除異方差帶來的不良影響。最常用的方法是加權最小二乘法(Weighted Least Squares, WLS)。,,,自相關的檢驗,DW檢驗用來檢驗殘差的自相關。檢驗統(tǒng)計量為: DW=2表示無自相關,在0-2之間說明存在正自相關,在2-4之間說明存在負的自相關。一般情況下,DW值在1.5-2.5之間即可說明無自相關現(xiàn)象。,異方差和自相關的處理方法,5. 多重共

29、線性分析 多重共線性是指解釋變量之間存在線性相關關系的現(xiàn)象。測度多重共線性一般有以下方式:1) 容忍度:其中, 是第i個解釋變量與方程中其他解釋變量間的復相關系數(shù)的平方,表示解釋變量之間的線性相關程度。容忍度的取值范圍在0-1之間,越接近0表示多重共線性越強,越接近1表示多重共線性越弱。2) 方差膨脹因子VIF。方差膨脹因子是容忍度的倒數(shù)。VIF越大多重共線性越強,當VIF大于等于10時,說明存在嚴重的多重共線性。,3)

30、 特征根和方差比。根據(jù)解釋變量的相關系數(shù)矩陣求得的特征根中,如果最大的特征根遠遠大于其他特征根,則說明這些解釋變量間具有相當多的重復信息。如果某個特征根既能夠刻畫某解釋變量方差的較大部分比例(0.7以上),又能刻畫另一解釋變量方差的較大部分比例,則表明這兩個解釋變量間存在較強的線性相關關系。4) 條件指數(shù)。指最大特征根與第i個特征根比的平方根。通常,當條件指數(shù)在0-10之間時說明多重共線性較弱;當條件指數(shù)在10-100之間說明多重共線

31、性較強;當條件指數(shù)大于100時說明存在嚴重的多重共線性。,從有共線性問題的變量中刪除不重要的變量;增加樣本量或重新抽取樣本;采用其它方法擬合模型:如逐步回歸、嶺估計、主成分分析法等。,,多重共線性分析的處理方法,8.4.3 基本操作,1) 選擇菜單Analyze ?Regression ?Linear,出現(xiàn)窗口:,相關回歸分析(高??蒲醒芯浚?sav,2) 選擇被解釋變量進入Dependent框。3)選擇一個或多個解釋變量進入

32、 Independent(s)框。4) 在Method框中選擇回歸分析中解釋變量的篩選策略。其中Enter表示所選變量強行進入回歸方程,是SPSS默認的策略,通常用在一元線性回歸分析中;Remove表示從回歸方程中剔除所選變量;Stepwise表示逐步篩選策略;Backward表示向后篩選策略;Forward表示向前篩選策略。,注:多元回歸分析中,變量的篩選一般有向前篩選、向后篩選、逐步篩選三種基本策略。(重點)向前篩選( Fo

33、rward )策略:解釋變量不斷進入回歸方程的過程。首先,選擇與被解釋變量具有最高線性相關系數(shù)的變量進入方程,并進行回歸方程的各種檢驗;然后,在剩余的變量中尋找與被解釋變量偏相關系數(shù)最高且通過檢驗的變量進入回歸方程,并對新建立的回歸方程進行各種檢驗;這個過程一直重復,直到再也沒有可進入方程的變量為止。向后篩選( Backward )策略:變量不斷剔除出回歸方程的過程。首先,所有變量全部引入回歸方程,并對回歸方程進行各種檢驗;然后,在回

34、歸系數(shù)顯著性檢驗不顯著的一個或多個變量中,,剔除t檢驗值最小的變量,并重新建立回歸方程和進行各種檢驗;如果新建回歸方程中所有變量的回歸系數(shù)檢驗都顯著,則回歸方程建立結束。否則按上述方法再一次剔除最不顯著的變量,直到再也沒有可剔除的變量為止。逐步篩選( Stepwise )策略:在向前篩選策略的基礎上結合向后篩選策略,在每個變量進入方程后再次判斷是否存在應該剔除出方程的變量。因此,逐步篩選策略在引入變量的每一個階段都提供了再剔除不顯著變

35、量的機會。,5) 第三和第四步中確定的解釋變量及變量篩選策略可放置在不同的塊(Block)中。通常在回歸分析中不止一組待進入方程的解釋變量和相應的篩選策略,可以單擊Next和Previous按鈕設置多組解釋變量和變量篩選策略并放置在不同的塊中。6) 選擇一個變量作為條件變量放到Selection Variable框中,并單擊Rule按鈕給定一個判斷條件。只有變量值滿足判定條件的樣本才參與線性回歸分析.7) 在Case Labels框

36、中指定哪個變量作為樣本數(shù)據(jù)點的標志變量,該變量的值將標在回歸分析的輸出圖形中。,剔除t檢驗值最小的變量,并重新建立回歸方程和進行各種檢驗;如果新建回歸方程中所有變量的回歸系數(shù)檢驗都顯著,則回歸方程建立結束。否則按上述方法再一次剔除最不顯著的變量,直到再也沒有可剔除的變量為止。逐步篩選( Stepwise )策略:在向前篩選策略的基礎上結合向后篩選策略,在每個變量進入方程后再次判斷是否存在應該剔除出方程的變量。因此,逐步篩選策略在引入變

37、量的每一個階段都提供了再剔除不顯著變量的機會。,5) 第三和第四步中確定的解釋變量及變量篩選策略可放置在不同的塊(Block)中。通常在回歸分析中不止一組待進入方程的解釋變量和相應的篩選策略,可以單擊Next和Previous按鈕設置多組解釋變量和變量篩選策略并放置在不同的塊中。6) 選擇一個變量作為條件變量放到Selection Variable框中,并單擊Rule按鈕給定一個判斷條件。只有變量值滿足判定條件的樣本才參與線性回歸分析

38、.7) 在Case Labels框中指定哪個變量作為樣本數(shù)據(jù)點的標志變量,該變量的值將標在回歸分析的輸出圖形中。,8.4.4 線性回歸分析的其他操作,1、Statistics按鈕,出現(xiàn)的窗口可供用戶選擇更多的輸出統(tǒng)計量。,統(tǒng)計量對話框,1) Estimates:SPSS默認輸出項,輸出與回歸系數(shù)相關的統(tǒng)計量。包括回歸系數(shù)(偏回歸系數(shù))、回歸系數(shù)標準誤差、標準化回歸系數(shù)、回歸系數(shù)顯著性檢驗的t統(tǒng)計量和概率p值,各解釋變量的容忍度。2)

39、 Confidence Intervals:輸出每個非標準化回歸系數(shù)95%的置信區(qū)間。3) Descriptive:輸出各解釋變量和被解釋變量的均值、標準差、相關系數(shù)矩陣及單側檢驗概率p值。7) Covariance matrix:輸出方程中各解釋變量間的相關系數(shù)、協(xié)方差及各回歸系數(shù)的方差.,4) Model fit:SPSS默認輸出項,輸出判定系數(shù)、調整的判定系數(shù)、回歸方程的標準誤差、回歸方程顯著F檢驗的方程分析表。5) R s

40、quared change:輸出每個解釋變量進入方程后引起的判定系數(shù)的變化量和F值的變化量。6) Part and partial correlation:輸出方程中各解釋變量與被解釋變量之間的簡單相關、偏相關系數(shù)。,8) Collinearity Diagnostics:多重共線性分析,輸出各個解釋變量的容忍度、方差膨脹因子、特征值、條件指標、方差比例等。9) 在Residual框中:Durbin-waston表示輸出DW檢驗值;

41、Casewise Diagnostic表示輸出標準化殘差絕對值大于等于3(SPSS默認值)的樣本數(shù)據(jù)的相關信息,包括預測值、殘差、杠桿值等。,2、Options選項,出現(xiàn)的窗口可供用戶設置多元線性回歸分析中解釋變量篩選的標準以及缺失值的處理方式。,選項對話框,3、Plot選項,出現(xiàn)的窗口用于對殘差序列的分析。,繪制對話框,1) 窗口左邊框中各變量名的含義是:DEPENDNT表示被解釋變量,*ZPRED表示標準化預測值,*ZRESID表示

42、標準化殘差,*DRESID表示剔除殘差,*ADJPRED表示調整的預測值,*SRESID表示學生化殘差,*SDRESID表示剔除學生化殘差.2) 繪制多對變量的散點圖,可根據(jù)需要在scatter框中定義散點圖的縱坐標和橫坐標變量。3) 在Standardized Residual Plots框中選擇Histogram選項繪制標準化殘差序列的直方圖;選擇Normal probability plot繪制標準化殘差序列的正態(tài)分布累計概率

43、圖。選擇Produce all partial plots選項表示依次繪制被解釋變量和各個解釋變量的散點圖。,保存對話框,4、Save選項,該窗口將回歸分析的某些結果以SPSS變量的形式保存到數(shù)據(jù)編輯窗口中,并可同時生成XML格式的文件,便于分析結果的網(wǎng)絡發(fā)布。1) Predicted Values框中:保存非標準化預測值、標準化預測值、調整的預測值和預測值的均值標準誤差.2) Predicted Interval框中:保存均值或個

44、體預測值95%(默認)置信區(qū)間的下限值和上限值。3) Residual框中:保存非標準化殘差、標準化殘差等。4) Influence Statistics框中:保存剔除第i個樣本后統(tǒng)計量的變化量。5、WSL選項,采用加權最小二乘法替代普通最小二乘法估計回歸參數(shù),并指定一個變量作為權重變量。,8.4.5 應用舉例,以高校科研研究數(shù)據(jù)為例,建立回歸方程研究1、課題總數(shù)受論文數(shù)的影響2、以課題總數(shù)X5為被解釋變量,解釋變量為投入人年

45、數(shù)X2、投入高級職稱的人年數(shù)X3、投入科研事業(yè)費X4、專著數(shù)X6、論文數(shù)X7、獲獎數(shù)X8。1) 解釋變量采用強制進入策略(Enter),并做多重共線性檢測。2) 解釋變量采用向后篩選策略讓SPSS自動完成解釋變量的選擇。3) 解釋變量采用逐步篩選策略讓SPSS自動完成解釋變量的選擇。,相關回歸分析(高??蒲醒芯浚?sav,強制進入策略-操作,回歸方程的擬合優(yōu)度檢驗(判定系數(shù)),回歸方程的顯著性檢驗,強制進入策略-結果,回歸

46、系數(shù)的顯著性檢驗,回歸參數(shù)的估計值,變量的多重共線性檢驗,接近0說明共線性強,>10說明共線性強,總之,有多個影響變量不顯著,且變量間共線性強,強制進入策略-結果,變量的多重共線性檢驗?特征根和方差比.第7個特征根可解釋多個變量的大部分方差,強制進入策略-結果,向后篩選策略-操作,向后篩選策略-操作,,回歸方程的擬合優(yōu)度檢驗(判定系數(shù)),向后篩選策略-結果,DW值在1.5-2.5之間,可以說明沒有自相關現(xiàn)象,回

47、歸方程的顯著性檢驗,向后篩選策略-結果,向后篩選策略-結果,回歸參數(shù)的估計+回歸系數(shù)的顯著性檢驗,向后篩選策略-結果,每步排除的變量,向后篩選策略-結果,殘差累計概率圖,從圖中可知殘差近似服從標準正態(tài)分布,向后篩選策略-結果,殘差圖,從圖中可知,數(shù)據(jù)點無明顯規(guī)律,殘差序列是獨立,且都在±3個標準差范圍內,無異常點,向后篩選策略-結果,標準化殘差和標準化預測值的Spearman等級相關分析-操作,標

48、準化殘差和標準化預測值的Spearman等級相關分析結果,計算殘差與預測值的相關性弱,認為異方差現(xiàn)象不明顯,標準化殘差的非參數(shù)檢驗-操作,標準化殘差的非參數(shù)檢驗結果,可認為標準化殘差服從標準正態(tài)分布,練習,1、為研究收入和支出的關系,收集1978-2002年我國的年人均可支配收入和年人均消費性支出數(shù)據(jù),研究收入與支出之間是否具有較強的線性關系。2、以年人均支出和教育數(shù)據(jù)為例,建立回歸方程研究年人均消費支出、恩格爾系數(shù)、在外就餐、教

49、育支出、住房人均使用面積受年人均可支配收入的影響。,相關回歸分析(年人均消費支出和教育).sav,1、分析?回歸?權重估計。,加權回歸的舉例,mallcost.sav,輸出結果,1、分析?回歸?兩階最小二乘法。,兩階最小二乘法 (自學),cross_sell.sav,兩階最小二乘法的SPSS實現(xiàn),可進一步閱讀參考書,杜強、賈麗艷,《SPSS統(tǒng)計分析從入門到精通》,人民郵電出版社,2011年該書中的第8.9章節(jié),兩階最小二乘回歸.,Th

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論