兩變量關(guān)聯(lián)性分析介紹_第1頁
已閱讀1頁,還剩41頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第十一章 兩變量關(guān)聯(lián)性分析,,,,一般地,兩個(gè)連續(xù)隨機(jī)變量間的線性聯(lián)系稱為線性相關(guān)(linear correlation),也稱為簡(jiǎn)單相關(guān)(simple correlation),兩個(gè)分類變量間的聯(lián)系則稱為關(guān)聯(lián)(association)。,散點(diǎn)圖,判斷兩個(gè)變量是否具有相關(guān)關(guān)系最直觀的辦法是繪制散點(diǎn)圖(scatter plot),在實(shí)際研究中也是首先要做的一步。將兩變量置于直角坐標(biāo)軸上,把其中一變量取作X, 另一個(gè)取作Y,據(jù)此在直角坐

2、標(biāo)系(X,Y ) 中標(biāo)出對(duì)應(yīng)的點(diǎn)來,這樣的圖形稱作散點(diǎn)圖。常見的散點(diǎn)圖如圖11-2所示。,相關(guān)的種類,1)正相關(guān)(positive correlation):一般地,在圖中若有隨增大而線性上升的趨勢(shì),則稱為正相關(guān)。2)負(fù)相關(guān)(negative correlation):在圖中若有隨增大而線性下降的趨勢(shì),則稱負(fù)相關(guān)。3)零相關(guān)(zero correlation):在圖中若或不隨另一變量的改變而改變 ,則稱零相關(guān)。4)非線性相關(guān)(no

3、nlinear correlation) :若散點(diǎn)呈曲線形狀,則變量間可能呈曲線關(guān)系,不宜做線性相關(guān)。,關(guān)聯(lián)強(qiáng)度指標(biāo)--相關(guān)系數(shù),意義:相關(guān)系數(shù)(correlation coefficient)又稱Pearson積差相關(guān)系數(shù),用來說明具有直線關(guān)系的兩變量間相關(guān)的密切程度與相關(guān)方向。,2. 計(jì)算:樣本相關(guān)系數(shù)的計(jì)算公式為,(11-3),,相關(guān)系數(shù)的特點(diǎn),1.相關(guān)系數(shù)r是一個(gè)無量綱的數(shù)值,且-10為正相關(guān),r<0為負(fù)相關(guān);3./

4、r/越接近于1,說明相關(guān)性越好./r/越接近于0,說明相關(guān)性越差.,例11-2 計(jì)算例11-1中凝血酶濃度X與凝血酶時(shí)間Y之間樣本相關(guān)系數(shù)。 由例11-1得 , , 由公式11-3得,,,,,,,,,相關(guān)系數(shù)的統(tǒng)計(jì)推斷,相關(guān)系數(shù)的假設(shè)檢驗(yàn)直接查相關(guān)系數(shù)臨界值表;

5、 t檢驗(yàn) (11-5) (11-6),,,例11-3 繼例11-2中算得r=-0926后,試檢驗(yàn)相關(guān)是否具有統(tǒng)計(jì)學(xué)意義,檢驗(yàn)步驟,本例

6、n=15,r=-0.926,由公式(11-4)和公式(11-5)得,,本例 ,查 界值表得 ,故拒絕 接受 ,認(rèn)為凝血酶濃度與凝血酶時(shí)間之間存在負(fù)相關(guān)。此結(jié)果與查表的結(jié)果是一致的。,線性相關(guān)中應(yīng)注意的問題,1.樣本的相關(guān)系數(shù)接近零并不意味著兩變量間一定無相關(guān)性.兩個(gè)有聯(lián)系的變量并非都屬線性聯(lián)系。兩變量間無線性關(guān)系,但卻存在非線性的曲線聯(lián)系。例如,很高血壓和很低血

7、壓的人死亡率均較高, 而中等血壓的人死亡率較低, 于是, 死亡率和血壓之間有曲線性聯(lián)系。還有如血液濃度與時(shí)間之間的關(guān)系、某放射性污染物對(duì)環(huán)境的污染濃度與污染源距離之間的關(guān)系等,都有曲線性聯(lián)系,但它們的樣本相關(guān)系數(shù)卻都接近零。 故通常應(yīng)先繪出樣本值的散點(diǎn)圖,利用散點(diǎn)圖可直觀地判斷兩變量之間是否具有線性聯(lián)系。,,2.一個(gè)變量的數(shù)值人為選定時(shí)莫作相關(guān)..一個(gè)變量的數(shù)值隨機(jī)變動(dòng),另一個(gè)變量的數(shù)值卻是人為選定的。例如, 為研究藥物的劑量-

8、反應(yīng)關(guān)系,,3.出現(xiàn)異常值時(shí)甚用相關(guān).,,4.相關(guān)未必真有內(nèi)在聯(lián)系.,,5.分層資料盲目合并易出假象,,第二節(jié) 秩相關(guān)(rank correlation),等級(jí)相關(guān),適用條件:,①資料不服從雙變量正態(tài)分布而不宜作積差相關(guān)分析;②總體分布型未知,一端或兩端是不確定數(shù)值(如<10歲,≥65歲)的資料;③原始數(shù)據(jù)用等級(jí)表示的資料。,一、Spearman秩相關(guān),1. 意義:等級(jí)相關(guān)系數(shù)rs用來說明兩個(gè)變量間直線相關(guān)關(guān)系的密切程度與

9、相關(guān)方向。2. 計(jì)算公式 d為p,q之差,例11-4 某地研究2~7歲急性白血病患兒的血小板數(shù)與出血癥狀程度之間的相關(guān)性,結(jié)果見表11-2,試用秩相關(guān)進(jìn)行分析,表11-2 急性白血病患兒的血小板(109/L)和出血癥狀,利用表11-2中的數(shù)據(jù)容易算得 秩相關(guān)系數(shù)為負(fù),說明兩變量間有負(fù)相關(guān)關(guān)系,同樣由樣本算得的秩相關(guān)系數(shù)是否有統(tǒng)計(jì)學(xué)意義,也應(yīng)做檢驗(yàn),,,,,秩相關(guān)系數(shù)的統(tǒng)計(jì)推斷,檢驗(yàn)步驟

10、假設(shè)檢驗(yàn) 統(tǒng)計(jì)推斷 當(dāng) 時(shí),可查書后的 臨界值表,若秩相關(guān)系數(shù)超過臨界值,則拒絕 ;當(dāng) 時(shí),也可采用公式(11-5)或(11-6)式做 檢驗(yàn),,,,,,,,,,,,,,例11-5 對(duì)例1-4的秩相關(guān)系數(shù)作假設(shè)檢驗(yàn),例11-4中算得 查 臨界值表, ,按

11、 的水準(zhǔn),不能拒絕 ,可以認(rèn)為急性白血病患兒的出血癥狀與血小板數(shù)之間無相關(guān)關(guān)系,,,,,,第三節(jié) 分類變量的關(guān)聯(lián)性分析,適用條件對(duì)定性變量之間的聯(lián)系通用的方法是根據(jù)兩個(gè)定性變量交叉分類基數(shù)所得的頻數(shù)資料(列聯(lián)表)作關(guān)聯(lián)性分析,即關(guān)于兩種屬性獨(dú)立性的卡方檢驗(yàn)計(jì)算公式,,,,交叉分類2×2表的關(guān)聯(lián)分析,例11-6 為觀察嬰兒腹瀉是否與喂養(yǎng)方式有關(guān),某醫(yī)院兒科隨機(jī)收集了消化不良的嬰兒82例,對(duì)每個(gè)個(gè)體分別觀察腹瀉

12、與否和喂養(yǎng)方式兩種屬性,2×2種結(jié)果分類記述如表11-3所示,試分析兩種屬性的關(guān)聯(lián)性。,表11-3嬰兒腹瀉與喂養(yǎng)方式的關(guān)系,假設(shè)檢驗(yàn) :喂養(yǎng)方式與嬰兒腹瀉之間相互獨(dú)立 :喂養(yǎng)方式與嬰兒腹瀉之間有關(guān)聯(lián)將表中各數(shù)據(jù)代入公式(7-7)得 , 拒絕原假設(shè),說明嬰兒腹瀉與喂養(yǎng)方式之間存在關(guān)聯(lián)性.,,,,,,,表11-3 嬰兒腹瀉與喂養(yǎng)方

13、式的關(guān)系,兩個(gè)分類變量關(guān)聯(lián)的程度--Pearson列聯(lián)系數(shù) (contingency coefficient),二 2×2配對(duì)資料的關(guān)聯(lián)性分析,例11-7 有56份咽喉涂抹標(biāo)本,把每份標(biāo)本一分為二,依同樣的條件分別接種于甲乙兩種白喉?xiàng)U菌培養(yǎng)基上,觀察白喉菌生長的情況,結(jié)果如表11-5,問兩種培養(yǎng)基的結(jié)果有無關(guān)聯(lián)?,表11-5 兩種白喉?xiàng)U菌培養(yǎng)結(jié)果,假設(shè)檢驗(yàn) :兩種培養(yǎng)基的結(jié)果之間互相獨(dú)立

14、 :兩種培養(yǎng)基的結(jié)果之間有關(guān)聯(lián)將本例數(shù)據(jù)代入公式(7-7)得有理由拒絕零假設(shè),可以認(rèn)為甲、乙兩種培養(yǎng)基之間存在關(guān)聯(lián)性,,,,,,三 R×C表分類資料的關(guān)聯(lián)性分析,例11-8 某地居民主要有三種祖籍,均流行甲狀腺腫。為探索甲狀腺腫類型與祖籍是否有關(guān)聯(lián),現(xiàn)根據(jù)居民甲狀腺腫篩查結(jié)果,按甲狀腺腫類型與祖籍兩種屬性交叉分類,得表11-6的資料。問甲狀腺腫類型與祖籍見有否關(guān)聯(lián)?,表11-6 某地居民按甲

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論