2023年全國(guó)碩士研究生考試考研英語(yǔ)一試題真題(含答案詳解+作文范文)_第1頁(yè)
已閱讀1頁(yè),還剩70頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、回歸分析線性回歸Logistic回歸對(duì)數(shù)線性模型,吳喜之,2,回歸分析,顧客對(duì)商品和服務(wù)的反映對(duì)于商家是至關(guān)重要的,但是僅僅有滿意顧客的比例是不夠的,商家希望了解什么是影響顧客觀點(diǎn)的因素以及這些因素是如何起作用的。 一般來(lái)說(shuō),統(tǒng)計(jì)可以根據(jù)目前所擁有的信息(數(shù)據(jù))建立人們所關(guān)心的變量和其他有關(guān)變量的關(guān)系(稱為模型)。假如用Y表示感興趣的變量,用X表示其他可能有關(guān)的變量(可能是若干變量組成的向量)。則所需要的是建立一個(gè)函數(shù)關(guān)系Y=

2、f(X)。這里Y稱為因變量或響應(yīng)變量,而X稱為自變量或解釋變量或協(xié)變量。建立這種關(guān)系的過(guò)程就叫做回歸。,3,回歸分析,一旦建立了回歸模型可以對(duì)各種變量的關(guān)系有了進(jìn)一步的定量理解還可以利用該模型(函數(shù))通過(guò)自變量對(duì)因變量做預(yù)測(cè)。這里所說(shuō)的預(yù)測(cè),是用已知的自變量的值通過(guò)模型對(duì)未知的因變量值進(jìn)行估計(jì);它并不一定涉及時(shí)間先后的概念。,4,例1 有50個(gè)從初中升到高中的學(xué)生.為了比較初三的成績(jī)是否和高中的成績(jī)相關(guān),得到了他們?cè)诔跞透咭坏?/p>

3、各科平均成績(jī)(數(shù)據(jù):highschool.sav),從這張圖可以看出什么呢?,5,還有定性變量,該數(shù)據(jù)中,除了初三和高一的成績(jī)之外,還有一個(gè)定性變量它是學(xué)生在高一時(shí)的家庭收入狀況;它有三個(gè)水平:低、中、高,分別在數(shù)據(jù)中用1、2、3表示。,6,還有定性變量,下面是對(duì)三種收入對(duì)高一成績(jī)和高一與初三成績(jī)差的盒形圖,7,例1:相關(guān)系數(shù),8,SPSS的相關(guān)分析,相關(guān)分析(hischool.sav)利用SPSS選項(xiàng):Analize-Correl

4、ate-Bivariate再把兩個(gè)有關(guān)的變量(這里為j3和s1)選入,選擇Pearson,Spearman和Kendall就可以得出這三個(gè)相關(guān)系數(shù)和有關(guān)的檢驗(yàn)結(jié)果了(零假設(shè)均為不相關(guān))。,9,定量變量的線性回歸分析,對(duì)例1中的兩個(gè)變量的數(shù)據(jù)進(jìn)行線性回歸,就是要找到一條直線來(lái)最好地代表散點(diǎn)圖中的那些點(diǎn)。,10,檢驗(yàn)問(wèn)題等,對(duì)于系數(shù)b1=0的檢驗(yàn)對(duì)于擬合的F檢驗(yàn)R2 (決定系數(shù)) =SSR/SST,可能會(huì)由于獨(dú)立變量增加而增加(有按自

5、由度修正的決定系數(shù):adjusted R2),簡(jiǎn)單回歸時(shí)R等于相關(guān)系數(shù),11,回到例1:R2等,12,SPSS的回歸分析,自變量和因變量都是定量變量時(shí)的線性回歸分析(hischool.sav) 利用SPSS選項(xiàng):Analize-Regression-Linear再把有關(guān)的自變量選入Independent,把因變量選入Dependent,然后OK即可。如果自變量有多個(gè)(多元回歸模型),只要都選入就行。,多個(gè)自變量的回歸,如何解釋擬合

6、直線?,什么是逐步回歸方法?,14,例子:RISKFAC.sav,不算序號(hào)和(192個(gè))國(guó)家有21個(gè)變量包括地區(qū)(Region)、(在城鎮(zhèn)和鄉(xiāng)村)使用干凈水的%、生活污水處理的%、飲酒量(litre/yearperson)、(每萬(wàn)人中)內(nèi)科醫(yī)生數(shù)目、護(hù)士和助產(chǎn)士數(shù)、衛(wèi)生工作者數(shù)、病床數(shù)、護(hù)士助產(chǎn)士和內(nèi)科醫(yī)生之比、衛(wèi)生開(kāi)支占總開(kāi)支的%、占政府開(kāi)支的%、人均衛(wèi)生開(kāi)支$、成人識(shí)字率、人均收入$、每千個(gè)出生中5歲前死亡人數(shù)、人口增長(zhǎng)率%、(男

7、女的)預(yù)期壽命(年)、每10萬(wàn)生育的母親死亡數(shù),15,16,例子:RISKFAC.sav,該數(shù)據(jù)有許多相關(guān)的變量和許多缺失值假定要用各種變量描述每千個(gè)出生中5歲前死亡人數(shù)(因變量)可以先做兩兩相關(guān)也可以做定量變量的兩兩散點(diǎn)圖等等或者用逐步回歸淘汰變量目的在于摸清關(guān)系的底細(xì),17,例子:RISKFAC.sav:相關(guān),18,例子:RISKFAC.sav:逐步回歸,選中女性預(yù)期壽命和農(nóng)村干凈水的%作為自變量(第二個(gè)自變量相對(duì)不那么顯

8、著pvalue=0.019),模型:女性預(yù)期壽命模型:農(nóng)村干凈水的%,19,RISKFAC.sav:散點(diǎn)圖及自變量相關(guān)性Pearson相關(guān),20,RISKFAC.sav:散點(diǎn)圖及自變量相關(guān)性非參數(shù)度量KendallSpearman,21,介紹三個(gè)檢查異常點(diǎn)的統(tǒng)計(jì)量,殘差(Residual).(本例用SPSS中的一種),它描述了樣本點(diǎn)到回歸直線的遠(yuǎn)近程度。杠桿值(Levarage)。 它描述距離數(shù)據(jù)總體的遠(yuǎn)近。高杠桿點(diǎn)對(duì)回歸的參

9、數(shù)影響較大,但其殘差通常較小。Cook統(tǒng)計(jì)量。它結(jié)合了殘差和杠桿值,因此反映了殘差和杠桿二者的影響(較全面),全模型(兩個(gè)自變量:女性預(yù)期壽命和農(nóng)村干凈水的%),,23,RISKFAC.sav:全模型異常點(diǎn)診斷:殘差,96(Lesotho ),23(Botswana),153(Sierra Leone ),192(Zimbabwe ),模型:女性預(yù)期壽命模型:農(nóng)村干凈水的%,24,RISKFAC.sav:全模型異常點(diǎn)診斷高

10、杠桿點(diǎn),23(Botswana),140(Romania ),192(Zimbabwe ),模型:女性預(yù)期壽命模型:農(nóng)村干凈水的%,25,RISKFAC.sav:全模型異常點(diǎn)診斷Cook距離,23(Botswana),96(Lesotho),192(Zimbabwe ),140(Romania ),模型:女性預(yù)期壽命模型:農(nóng)村干凈水的%,26,模型1因變量和自變量之一的散點(diǎn)圖X:女性預(yù)期壽命(年)Y:每千個(gè)出生中5歲前

11、死亡人數(shù),27,RISKFAC.sav:只用女性預(yù)期壽命作為自變量,模型:全模型模型:農(nóng)村干凈水的%,28,RISKFAC.sav模型1異常點(diǎn)診斷殘差,23(Botswana),96(Lesotho),192(Zimbabwe ),模型:全模型模型:農(nóng)村干凈水的%,29,RISKFAC.sav:模型1異常點(diǎn)診斷高杠桿點(diǎn)不太突出,模型:全模型模型:農(nóng)村干凈水的%,30,RISKFAC.sav:模型1異常點(diǎn)診斷Cook

12、距離,192(Zimbabwe ),96(Lesotho),23(Botswana),模型:全模型模型:農(nóng)村干凈水的%,31,模型2因變量和自變量之一的散點(diǎn)圖X:農(nóng)村干凈水使用%Y:每千個(gè)出生中5歲前死亡人數(shù),32,RISKFAC.sav:只用農(nóng)村凈水使用%,模型:全模型模型:女性預(yù)期壽命,33,140(Romania ),RISKFAC.sav模型2異常點(diǎn)診斷殘差,模型:全模型模型:女性預(yù)期壽命,34,RISKFAC

13、.sav:模型2異常點(diǎn)診斷高杠桿點(diǎn)不太突出,模型:全模型模型:女性預(yù)期壽命,35,RISKFAC.sav:模型2異常點(diǎn)診斷Cook距離,140(Romania ),模型:全模型模型:女性預(yù)期壽命,36,對(duì)該例子(RISKFAC.sav)的結(jié)果解釋,單獨(dú)用第一個(gè)自變量比單獨(dú)用第二個(gè)較好模型1(相應(yīng)于模型)的“異常點(diǎn)”為一些非洲國(guó)家;它們可能不適合用這個(gè)模型。模型2(相應(yīng)于模型)的“異常點(diǎn)”為Romania;它可能不適合用

14、這個(gè)模型。從散點(diǎn)圖來(lái)看,第一個(gè)模型更加線性。兩個(gè)自變量的模型的“異常點(diǎn)”為單獨(dú)模型“異常點(diǎn)”的混合。其實(shí),用一個(gè)自變量就夠了。這兩個(gè)自變量是相關(guān)的。當(dāng)然是用第一個(gè)了??赡馨旬惓|c(diǎn)排除后再重新建模更好。,37,自變量中有定性變量的回歸,例1的數(shù)據(jù)中,還有一個(gè)自變量是定性變量“收入”,以虛擬變量或啞元(dummy variable)的方式出現(xiàn);這里收入的“低”,“中”,“高”,用1,2,3來(lái)代表.所以,如果要用這種啞元進(jìn)行前面回歸就沒(méi)

15、有道理了. 以例1數(shù)據(jù)為例,可以用下面的模型來(lái)描述:,38,自變量中有定性變量的回歸,現(xiàn)在只要估計(jì)b0, b1,和a1, a2, a3即可。啞元的各個(gè)參數(shù)a1, a2, a3本身只有相對(duì)意義,無(wú)法三個(gè)都估計(jì),只能夠在有約束條件下才能夠得到估計(jì)。約束條件可以有很多選擇,一種默認(rèn)的條件是把一個(gè)參數(shù)設(shè)為0,比如a3=0,這樣和它有相對(duì)意義的a1和a2就可以估計(jì)出來(lái)了。對(duì)于例1,對(duì)b0, b1, a1, a2, a3的估計(jì)分別為28.7

16、08, 0.688, -11.066, -4.679, 0。這時(shí)的擬合直線有三條,對(duì)三種家庭收入各有一條:,39,例子:RISKFAC.sav:因變量:成人識(shí)字率,自變量:區(qū)域(屬性變量)、人口增長(zhǎng)率、人均收入,40,41,SPSS實(shí)現(xiàn)(hischool.sav),Analyze-General linear model-Univariate,在Options中選擇Parameter Estimates,再在主對(duì)話框中把因變量(s

17、1)選入Dependent Variable,把定量自變量(j3)選入Covariate,把定量因變量(income)選入Factor中。然后再點(diǎn)擊Model,在Specify Model中選Custom,再把兩個(gè)有關(guān)的自變量選入右邊,再在下面Building Term中選Main effect。Continue-OK,就得到結(jié)果了(系數(shù)和檢驗(yàn)等),SPSS Syntax:UNIANOVA s1 BY income WI

18、TH j3 /METHOD = SSTYPE(3) /INTERCEPT = INCLUDE /CRITERIA = ALPHA(.05) /DESIGN = income j3 .,43,注意,這里進(jìn)行的線性回歸,僅僅是回歸的一種,也是歷史最悠久的一種。但是,任何模型都是某種近似;線性回歸當(dāng)然也不另外。它被長(zhǎng)期廣泛深入地研究主要是因?yàn)閿?shù)學(xué)上相對(duì)簡(jiǎn)單。它已經(jīng)成為其他回歸的一個(gè)基礎(chǔ)??倯?yīng)該用批判的眼光看這些模型。

19、,44,例2 這是200個(gè)不同年齡和性別的人對(duì)某項(xiàng)服務(wù)產(chǎn)品的認(rèn)可的數(shù)據(jù)(logi.sav). 年齡是連續(xù)變量,性別是有男和女(分別用1和0表示)兩個(gè)水平的定性變量,而(定性)變量“觀點(diǎn)”則為包含認(rèn)可(用1表示)和不認(rèn)可(用0表示)兩個(gè)水平的定性變量。,從這兩張圖又可以看出什么呢?,45,Logistic 回歸,例2是關(guān)于200個(gè)不同年齡,性別的人對(duì)某項(xiàng)服務(wù)產(chǎn)品的觀點(diǎn)(二元定性變量)的數(shù)據(jù)(logi.sav).這里觀點(diǎn)是因變量, 只有兩

20、個(gè)值;所以可以把它看作成功概率為p的Bernoulli試驗(yàn)的結(jié)果.但是和單純的Bernoulli試驗(yàn)不同,這里的概率p為年齡和性別的函數(shù). 可以假定下面的(logistic回歸)模型,46,Logistic 回歸,為了循序漸近,先擬合沒(méi)有性別作為自變量(只有年齡x)的模型,47,Logistic模型擬合結(jié)果,依靠計(jì)算機(jī),很容易得到b0和b1的估計(jì)分別為2.380和-0.069。擬合的模型為,48,Logistic模型擬合結(jié)果,再加上

21、性別變量進(jìn)行擬合,得到的b0, b1和a0, a1的估計(jì)(同樣事先確定為a1=0)分別為1.722, -0.072, 1.778, 0.可以看出年齡影響對(duì)男女混和時(shí)(0.069)差不多,而女性相對(duì)于男性認(rèn)可的可能性大(a0-a1=1.778)。,49,擬合的年齡-概率圖,50,擬合優(yōu)度檢驗(yàn)Hosmer-Lemeshow-goodness-of-fit,這里p值=0.602(不顯著)。注意:在這里“顯著”意味著擬合不好!,51,SPSS

22、的Logistic回歸(logi.sav),自變量為定量變量時(shí):利用SPSS選項(xiàng):Analize-Regression-Binary Logistic,再把因變量(opinion)選入DependentVariable,把自變量(age)選入Covariates,OK即可得到結(jié)果。自變量為定量變量及定量變量時(shí):利用SPSS選項(xiàng):Analize-Regression-Binary Logistic,再把因變量(opinion)選入D

23、ependentVariable,把自變量(age和sex)選入Covariates,然后點(diǎn)Categorical,再把定性變量sex選入Categorical Covariate,回到主對(duì)話框,可在options選擇Hosmer-Lemeshow-goodness-of-fit檢驗(yàn)(檢驗(yàn)擬合優(yōu)度)點(diǎn)擊OK即可得到結(jié)果。,對(duì)數(shù)線性模型,多項(xiàng)分布對(duì)數(shù)線性模型Poisson對(duì)數(shù)線性模型,53,高維列聯(lián)表和多項(xiàng)分布對(duì)數(shù)線性模型,前面例子

24、原始數(shù)據(jù)是個(gè)三維列聯(lián)表,對(duì)三維列聯(lián)表的檢驗(yàn)也類似。但高維列聯(lián)表在計(jì)算機(jī)軟件的選項(xiàng)可有所不同,而且可以構(gòu)造一個(gè)所謂(多項(xiàng)分布)對(duì)數(shù)線性模型(loglinear model)來(lái)進(jìn)行分析。利用對(duì)數(shù)線性模型的好處是不僅可以直接進(jìn)行預(yù)測(cè),而且可以增加定量變量作為模型的一部分。,54,多項(xiàng)分布對(duì)數(shù)線性模型,現(xiàn)在簡(jiǎn)單直觀地通過(guò)二維表介紹一下對(duì)數(shù)線性模型,假定不同的行代表第一個(gè)變量的不同水平,而不同的列代表第二個(gè)變量的不同水平。用mij代表二維列聯(lián)

25、表第i行,第j列的頻數(shù)。人們常假定這個(gè)頻數(shù)可以用下面的公式來(lái)確定:,這就是所謂的多項(xiàng)分布對(duì)數(shù)線性模型。這里ai為行變量的第i個(gè)水平對(duì)ln(mij)的影響,而bj為列變量的第j個(gè)水平對(duì)ln(mij)的影響,這兩個(gè)影響稱為主效應(yīng)(main effect);eij代表隨機(jī)誤差。,55,多項(xiàng)分布對(duì)數(shù)線性模型,這個(gè)模型看上去和回歸模型很象,但由于對(duì)于分布的假設(shè)不同,不能簡(jiǎn)單地用線性回歸的方法來(lái)套用(和Logistic回歸類似);計(jì)算過(guò)程也很不一樣

26、。當(dāng)然我們把這個(gè)留給計(jì)算機(jī)去操心了。只要利用數(shù)據(jù)來(lái)擬合這個(gè)模型就可以得到對(duì)于參數(shù)m的估計(jì)(沒(méi)有意義),以及ai和bj的“估計(jì)”。有了估計(jì)的參數(shù),就可以預(yù)測(cè)出任何i,j水平組合的頻數(shù)mij了(通過(guò)其對(duì)數(shù))。注意,這里的估計(jì)之所以打引號(hào)是因?yàn)橐粋€(gè)變量的各個(gè)水平的影響是相對(duì)的,因此,只有事先固定一個(gè)參數(shù)值(比如a1=0),或者設(shè)定類似于Sai=0這樣的約束,才可能估計(jì)出各個(gè)的值。沒(méi)有約束,則這些參數(shù)是估計(jì)不出來(lái)的。,56,多項(xiàng)分布對(duì)數(shù)線性

27、模型,二維列聯(lián)表的更完全的對(duì)數(shù)線性模型為,這里的(ab)ij代表第一個(gè)變量的第i個(gè)水平和第二個(gè)變量的第j個(gè)水平對(duì)ln(mij)的共同影響(交叉效應(yīng))。即當(dāng)單獨(dú)作用時(shí),每個(gè)變量的一個(gè)水平對(duì)ln(mij)的影響只有ai(或bj)大,但如果這兩個(gè)變量一同影響就不僅是ai+bj,而且還多出一項(xiàng)。這里的交叉項(xiàng)的諸參數(shù)的大小也是相對(duì)的,也需要約束條件來(lái)得到其“估計(jì)”;涉及的變量和水平越多,約束也越多。,57,注意,無(wú)論你對(duì)模型假定了多少種效應(yīng),并

28、不見(jiàn)得都有意義;有些可能是多余的。本來(lái)沒(méi)有交叉影響,但如果寫(xiě)入,也沒(méi)有關(guān)系,在分析過(guò)程中一般可以知道哪些影響是顯著的,而那些是不顯著的。,58,用table7.sav數(shù)據(jù)擬合對(duì)數(shù)線性模型,假定(多項(xiàng)分布)對(duì)數(shù)線性模型為,這里ai為收入(i=1,2,3代表收入的低、中、高三個(gè)水平),bj為觀點(diǎn)(j=1,2代表不贊成和贊成兩個(gè)水平),gk為性別(k=1,2代表女性和男性兩個(gè)水平), mijk代表三維列聯(lián)表對(duì)于三個(gè)變量的第ijk水平組合的出現(xiàn)

29、次數(shù),eijk為殘差而從相應(yīng)的參數(shù)估計(jì)輸出結(jié)果,可以得到對(duì)ai的三個(gè)值的估計(jì)為0.5173, 0.2549,0.0000,對(duì)bj的兩個(gè)值的估計(jì)為-0.6931,0.0000,對(duì)gk的兩個(gè)值的估計(jì)為 0.1139,0.0000。(多項(xiàng)對(duì)數(shù)線性模型常數(shù)無(wú)意義,輸出的常數(shù)項(xiàng)僅僅是數(shù)學(xué)意義),59,SPSS輸出,就這里的三維列聯(lián)表問(wèn)題,如只考慮各個(gè)變量單獨(dú)的影響,而不考慮變量組合的綜合影響,其SPSS輸出的Pearson c2統(tǒng)計(jì)量和似然比c

30、2統(tǒng)計(jì)量得到的p-值分別為0.0029和0.0011。,60,SPSS輸出,61,62,SPSS的實(shí)現(xiàn),[數(shù)據(jù)table7.sav] 假定已加權(quán) (加權(quán)一次并存盤(pán)了既可) 這時(shí)的選項(xiàng)為Analyze-Loglinear-General,首先選擇格子中頻數(shù)的分布,這里是多項(xiàng)分布 (其默認(rèn)值是Poisson對(duì)數(shù)線性模型).把三變量(sex,opinion,income)選入Factors(因子);再選Model(模型),如果選Sat

31、urated(飽和模型),那就是所有交叉效應(yīng)都要放入模型;但如果不想這樣,可以選Custom(自定義),在Building Terms(構(gòu)造模型的項(xiàng))選Main effect(主效應(yīng)),再把三個(gè)變量一個(gè)一個(gè)地選進(jìn)來(lái)(如果兩個(gè)或三個(gè)一同選入,等于選入交叉效應(yīng)).如果想要知道模型參數(shù),在Options中選擇Estimates。最后Continue-OK即可得出結(jié)果.在計(jì)算機(jī)輸出的結(jié)果中可以找到我們感興趣的結(jié)果。如果SPSS的View

32、er輸出不完全,可以選中不完全的輸出,利用Edit-Copy Objects來(lái)復(fù)制到例如記事本那樣的文件中,就可以看到完整輸出了,63,Poisson對(duì)數(shù)線性模型,有的時(shí)候,類似的高維表并不一定滿足多項(xiàng)分布對(duì)數(shù)線性模型。下面看一個(gè)例子。這是關(guān)于哮喘病人個(gè)數(shù)和空氣污染程度,年齡和性別的數(shù)據(jù)(asthma.sav)后面表格為某地在一段時(shí)間記錄的60組在不同空氣污染狀態(tài)的不同年齡及不同性別的人的發(fā)生哮喘的人數(shù)。其中性別為定性變量S(sex

33、, 1代表女性,2代表男性),空氣污染程度P也是定性變量(polut, 1、2、3分別代表輕度、中度和嚴(yán)重污染),年齡A (age)為定量變量,為那一組人的平均年齡;還有一列計(jì)數(shù)C (count)為這一組的哮喘人數(shù)。這個(gè)表格和前面的列聯(lián)表的不同點(diǎn)在于每一格的計(jì)數(shù)并不簡(jiǎn)單是前面三個(gè)變量的組合的數(shù)目(某個(gè)年齡段,某種性別及某種污染下的人數(shù)),而是代表了某個(gè)年齡段,某種性別及某種污染下發(fā)生哮喘的人數(shù)。,64,Poisson分布簡(jiǎn)介在

34、某些固定的條件下, 人們認(rèn)為某些事件出現(xiàn)的次數(shù)服從Poisson分布, 比如在某一個(gè)時(shí)間段內(nèi)某種疾病的發(fā)生病數(shù), 顯微鏡下的微生物數(shù), 血球數(shù), 門(mén)診病人數(shù), 投保數(shù), 商店的顧客數(shù), 公共汽車到達(dá)數(shù), 電話接通數(shù)等等. 然而, 條件是不斷變化的. 因此, 所涉及的Poisson分布的參數(shù)也隨著變化.,66,Poisson對(duì)數(shù)線性模型,假定哮喘發(fā)生服從Poisson分布;但是由于條件不同,Poisson分布的參數(shù)l也應(yīng)該隨著條件的變化而

35、改變。這里的條件就是給出的性別、空氣污染程度與年齡。當(dāng)然,如何影響以及這些條件影響是否顯著則是我們所關(guān)心的。這個(gè)模型可以寫(xiě)成,這里m為常數(shù)項(xiàng),ai為性別(i=1,2分別代表女性和男性兩個(gè)水平),bj為空氣污染程度(j=1,2,3代表低、中高三個(gè)污染水平),x為連續(xù)變量年齡,而g為年齡前面的系數(shù),eij為殘差項(xiàng)。,67,68,69,Poisson對(duì)數(shù)線性模型,從對(duì)于數(shù)據(jù)(asthma.sav)的Poisson對(duì)數(shù)線性模型的相應(yīng)SPSS輸出

36、,可以得到對(duì)m的估計(jì)為4.9820,對(duì)ai的兩個(gè)值的“估計(jì)”為-0.0608、 0.0000,對(duì)bj的三個(gè)值的“估計(jì)”為-0.1484,0.1223、0.0000,對(duì)g的估計(jì)為 0.0126。注意,這里的對(duì)主效應(yīng)aI和bj的估計(jì)只有相對(duì)意義;它們?cè)谝粋€(gè)參數(shù)為0的約束條件下得到的。從模型看上去,年齡和性別對(duì)哮喘影響都不那么重要。輕度污染顯然比中度污染和嚴(yán)重污染哮喘要好。但是似乎嚴(yán)重污染時(shí)哮喘稍微比中度污染少些(差別不顯著)。通過(guò)更進(jìn)

37、一步的分析(這里不進(jìn)行),可以發(fā)現(xiàn),中度和嚴(yán)重空氣污染(無(wú)論單獨(dú)還是一起)和輕度空氣污染比較都顯著增加哮喘人數(shù),而中度及嚴(yán)重污染時(shí)的哮喘人數(shù)并沒(méi)有顯著區(qū)別。,70,SPSS的實(shí)現(xiàn),[數(shù)據(jù)asthma.sav] 假定已經(jīng)加權(quán) 這時(shí)的選項(xiàng)為Analyze-Loglinear-General,首先選擇格子中頻數(shù)的分布,這里是Poisson分布。然后把兩個(gè)變量(sex,polut)選入Factors(因子),把a(bǔ)ge選入Cell Cova

38、riate(s)。再選Model(模型),這里以選Custom(自定義),在Building Terms(構(gòu)造模型的項(xiàng))選Main effect(主效應(yīng)),再把三個(gè)變量一個(gè)一個(gè)地選進(jìn)來(lái)。如果想要知道模型參數(shù),在Options中選擇Estimates。最后Continue-OK即可得出結(jié)果。在結(jié)果中可以找到有關(guān)Pearson c2統(tǒng)計(jì)量和似然比c2統(tǒng)計(jì)量的檢驗(yàn)結(jié)果及參數(shù)的估計(jì)(如果SPSS的Viewer輸出不完全,可以選中不完全的輸

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論