版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第 三節(jié),資料的統(tǒng)計(jì)描述,一 計(jì)量資料的統(tǒng)計(jì)描述,頻數(shù)分布集中趨勢(shì)指標(biāo)離散趨勢(shì)指標(biāo),(一) 頻數(shù)分布,一、頻數(shù)分布表簡稱頻數(shù)表(frequency table),例9-7 (P187),1. 頻數(shù)表的編制,(1)計(jì)算極差(range):即最大值與最小值之差,又稱為全距。 本例極差: R=5.91-3.86=2.05(×1012/L)(2) 確定組數(shù)、組距和組限:根據(jù)研究目的和樣本含量n
2、確定。組數(shù)通常分8-15個(gè)組,為方便計(jì),組距參考極差的十分之一, 再略加調(diào)整。本例:i= R /10=2.05/10=0.205≈0.20。 組距=極差/擬分組數(shù) 組限:每個(gè)組段的起點(diǎn)為上限,終點(diǎn)為下限;第一組段要包括最小值,最后一個(gè)組段必須包含最大值。(3) 列表劃記:用劃記法將所有數(shù)據(jù)歸納到各組段,得到各組段的頻數(shù)。,2、頻數(shù)分布圖(graph of frequency distribution),3 頻數(shù)分布
3、的兩個(gè)特征,集中趨勢(shì),central tendency指變量值的中心數(shù)值或中心位置所在。離散趨勢(shì),tendency of dispersion指變量值圍繞中心數(shù)值或中心位置的分布情況。,4 頻數(shù)分布的類型,對(duì)稱分布:集中位置居中,左右兩邊對(duì)稱 (特例:正態(tài)分布)偏態(tài)分布:正偏態(tài)分布(峰偏左) 負(fù)偏態(tài)分布,5、頻數(shù)表的用途,揭示頻數(shù)
4、的分布特征和分布類型;可以代替原始資料,便于計(jì)算和分析;便于發(fā)現(xiàn)某些特大或特小的可疑值。,(二) 集中趨勢(shì)的描述,平均數(shù)(average):用于觀察一組同質(zhì)變量值的平均水平/集中位置。亦稱中心位置指標(biāo)。它不但給人一個(gè)簡明概括的印象,而且便于事物間的分析比較。常用的平均數(shù)算術(shù)均數(shù) (arithmetic mean/mean) 幾何均數(shù) (geometric mean)中位數(shù) (median),1、算術(shù)均數(shù),簡稱均數(shù)(arit
5、hmetic mean/mean),均數(shù)是算術(shù)均數(shù)的簡稱??傮w均數(shù)用希臘字母μ(繆,mu)表示樣本均數(shù) (X bar)表示。,均數(shù)的應(yīng)用條件,主要用于對(duì)稱性或近似對(duì)稱性分布的資料;尤其是在正態(tài)分布或近似正態(tài)分布上的應(yīng)用。,計(jì)算方法 1.直接法,Σ:希臘字母(sigma),求和符號(hào)例9.2 有8名正常人的空腹血糖值(mmol/L): 6.2,5.4,5.7,5.3,6.1,6.0,5.8,5.9
6、 6.2+5.4+5.7+5.3+6.1+6.0+5.8+5.9 = =5.8 8,,2.加權(quán)法,加權(quán)法計(jì)算均數(shù):,Xj 為各組的組中值。組中值等于該組的上
7、限加下限之和除以2。 fj 為各組的頻數(shù)。101名正常成年女子的血清總膽固醇均值為: = 409.75/101 =4.06( mmol/L ),(二)幾何均數(shù) Geometric mean,G,描述一組呈倍數(shù)(等比)關(guān)系的觀察值的平均水平。適用:數(shù)據(jù)呈正偏態(tài)分布,經(jīng)對(duì)數(shù)轉(zhuǎn)換后呈正態(tài)分布。多用于觀察值之間呈倍數(shù)關(guān)系,如抗體滴度計(jì)算方法直接法 加權(quán)法,1.直接法,例:有8份血清的抗體效價(jià)為1:
8、5,1:10,1:20,1:40,1:80, 1:160 ,1:320,1:640。求平均效價(jià)。,用直接法計(jì)算G,將各效價(jià)的倒數(shù)代入公式,得該8份血清的平均抗體效價(jià)為1:56.57,近似為1:57注意:變量值不能有0,2.加權(quán)法,式中f為頻數(shù)。,用加權(quán)法計(jì)算G,例 30名麻疹易感兒童接種麻疹疫苗一個(gè)月后,血凝抑制抗體滴度如下表所示,試求其平均抗體滴度。,30名麻疹易感兒童血凝抑制抗體滴度,∑flgX=50.58,30名麻疹易感兒童
9、接種麻疹疫苗一個(gè)月后血凝抑制抗體滴度為1:48.5,同一組資料求得的幾何均數(shù)小于均數(shù)。,將一組觀察值從小到大按順序排列,位次居中的觀察值,即為中位數(shù)。一半的值比M小,一半的值比M大。,(三)中位數(shù) Median, M,例:1,3,5,7,18 (奇數(shù)) 1,3,5,7,18,20 ( 偶數(shù)) 計(jì)算n為奇數(shù)時(shí)n為偶數(shù)時(shí),M計(jì)算方法,例: 9人某病潛伏期(天
10、)分別為3,4,4,5,6,7,7,19,19,求中位數(shù)。 例: 6名新生兒身長(cm)分別為50.1,52.0,53.0,55.0,55.0,56.0,求中位數(shù)。,,中位數(shù)的應(yīng)用條件,偏態(tài)分布或分布狀態(tài)不明的資料;觀察值中有個(gè)別過小或過大值的資料分布的一端或兩端無確定的數(shù)值; (如:>50, 或 <10)注意:在完全對(duì)稱的單峰曲線分布中,同一組資料的均數(shù)與中位數(shù)相同, Mean = Median,
11、中位數(shù)的優(yōu)缺點(diǎn),優(yōu)點(diǎn):不受個(gè)別特大或特小的觀察值影響;其它平均數(shù)不宜使用時(shí),中位數(shù)就顯示出它的優(yōu)越性。缺點(diǎn):掉失了大量信息,其敏感性不夠。,(三) 離散趨勢(shì)指標(biāo),例 有3組同齡男孩體重(kg)如下,其體重均數(shù) 都是30 (kg),試分析離散程度。甲組 26 28 30 32 34乙組 24 27 30 33 36丙組 26 29 30 31 34,離散程度(或變異程度),指
12、數(shù)據(jù)參差不齊的程度,反映資料的離散趨勢(shì)。將反映平均水平與離散程度的指標(biāo)結(jié)合起來使用,可全面地描述數(shù)據(jù)的分布規(guī)律。,1 極差( Range ),極差= 最大值 – 最小值優(yōu)點(diǎn):簡單明了缺點(diǎn):不能反映組內(nèi)其他數(shù)據(jù)的變異,樣本含量相差較大時(shí),不宜用極差比較分布的離散程度。,2 四分位數(shù)間距 inter-quartile range,百分位數(shù):指把數(shù)據(jù)從小到大排列后處于第X百分位置的數(shù)值。它將全部數(shù)據(jù)分為兩部分,在不包括PX的全部數(shù)據(jù)
13、中有X%數(shù)據(jù)小于PX,有1-X%的數(shù)據(jù)大于PX%。中位數(shù)是一個(gè)特定的百分位數(shù)P50。四分位數(shù):下四分位數(shù)P25;上四分位數(shù)P75 P0 —— P25 —— P50 —— P75 —— P100 四分位數(shù)間距: P75 - P25 或 QU - QL 比極差穩(wěn)定,但仍未考慮每個(gè)數(shù)據(jù)的大小。常和中位數(shù)結(jié)合使用描述數(shù)據(jù)的分布規(guī)律。,3 方差和標(biāo)準(zhǔn)差,離均差平方和:
14、 考慮每個(gè)觀察值,但受N的影響。對(duì)離均差平方和求均數(shù),得總體方差?2 ,開根號(hào)得標(biāo)準(zhǔn)差? 。,一般?未知,常常用 來估計(jì),數(shù)理統(tǒng)計(jì)證明,如用樣本的變量個(gè)數(shù)n來代替N,計(jì)算出的樣本方差比實(shí)際?2低,需要用n-1校正,得樣本方差S2。開根號(hào)得樣本標(biāo)準(zhǔn)差s。,自由度,degree of freedom,方差計(jì)算公式中的n-1被稱為自由度,它描述了當(dāng) 選定時(shí),n個(gè)X中能自由變動(dòng)的X(變量值)的個(gè)數(shù)。例:某樣本含有5個(gè)數(shù)
15、據(jù),要求∑X=15。則在自由確定了四個(gè)數(shù)據(jù)后,第5個(gè)數(shù)據(jù)只能是15-(x1+x2+x3+x4)。 即有4個(gè)數(shù)據(jù)可以自由變動(dòng),其自由度=4 。推而廣之,任何統(tǒng)計(jì)量的自由度?=n-k,k為限制條件的個(gè)數(shù)。 自由度:是隨機(jī)變量可以“自由”取值的個(gè)數(shù)。,總體標(biāo)準(zhǔn)差樣本標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)差 standard deviation,,,標(biāo)準(zhǔn)差的計(jì)算,甲組 26 28 30 32 34 標(biāo)準(zhǔn)差 3.16乙組 24
16、27 30 33 36 4.74丙組 26 29 30 31 34 2.92甲組:∑X=26+28+30+32+34=150∑X2=262+282+302+322+342=4540,用頻數(shù)表法計(jì)算標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)差的應(yīng)用:,反映一組觀察值的變異程度;衡量均數(shù)的代表性;結(jié)合樣本均數(shù)描述頻數(shù)分布特征;計(jì)算變異系數(shù)和標(biāo)準(zhǔn)誤;,標(biāo)準(zhǔn)
17、差與算術(shù)均數(shù)之比,反映了相對(duì)離散程度常用于比較度量衡單位不同的多組資料的變異度均數(shù)相差懸殊的多組資料的變異度,5 變異系數(shù) CV,例:度量衡單位不同的變異度,某地20歲男子110名身高 =172.73cm, s=4.09cm;體重 =55.04kg, s=4.10kg,試比較兩組資料的變異程度,即身高、體重的變異程度哪個(gè)大?,例:均數(shù)相差懸殊的變異度,
18、二 計(jì)數(shù)資料的統(tǒng)計(jì)描述,,常見的數(shù)據(jù)形式:,絕對(duì)數(shù),,相對(duì)數(shù),但絕對(duì)數(shù)通常不具有可比性。,例:甲地 麻疹發(fā)病人數(shù)30人 乙地 麻疹發(fā)病人數(shù)25人 地區(qū) 麻疹發(fā)病人數(shù) 易感兒童數(shù) 麻疹發(fā)病(%) 甲地 30 3000 1 乙地 25
19、 1000 2.5,,,,構(gòu)成比 率 相對(duì)比,常用的相對(duì)數(shù)指標(biāo):,1 構(gòu)成比,,表示事物內(nèi)部各組成部分的比重或分布,常以百分?jǐn)?shù)表示。,例1 本班有學(xué)生40名,其中男生15名,女生25名。性別構(gòu)成比:男生性別構(gòu)成比:15/40×100%=37.5%;女生性別構(gòu)成比:25/40×100%=62.5%,白細(xì)胞分類計(jì)數(shù),,構(gòu)成比的
20、特點(diǎn),(1)各部分構(gòu)成比的合計(jì)為100%。(2)事物內(nèi)部某一部分的構(gòu)成比發(fā)生變化, 其他部分構(gòu)成也發(fā)生變化。,說明某現(xiàn)象或某事物發(fā)生的頻率或強(qiáng)度。常用百分率(%)、千分率(‰)、萬分率( )、十萬分率( )來表示。,2 率,比例基數(shù)的選用一般依據(jù)習(xí)慣,使計(jì)算出來的率的結(jié)果保留1-2位整數(shù)。,例1 某醫(yī)院1998年在某城區(qū)隨機(jī)調(diào)查了8589例60歲及以上老人,體檢發(fā)現(xiàn)高血壓患者為2823
21、例,求高血壓的患病率。,例2 1999年某幼兒園有36名兒童患了腮腺炎,該幼兒園共有200名兒童(其中25名兒童以前患過),求該幼兒園1999年腮腺炎的發(fā)病率。,3 相對(duì)比(relative ratio) 是兩個(gè)相關(guān)聯(lián)的指標(biāo)之比。說明:(1)式中甲乙兩指標(biāo)可以是絕對(duì)數(shù)、平均數(shù)或相對(duì)數(shù);(2)式中甲乙兩指標(biāo)的性質(zhì)可以相同,也可以是性質(zhì)不同。,例1 某地某年出生的嬰兒中,男性嬰兒為484人,女性嬰兒為460人,求出生
22、嬰兒的性別比。 出生嬰兒的性別比例為484/460=1.052(或105:100),(二)應(yīng)用相對(duì)數(shù)的注意事項(xiàng),1 計(jì)算相對(duì)數(shù)時(shí)樣本含量應(yīng)足夠多,2 不能用構(gòu)成比代替率,3 注意資料的可比性,4 要考慮存在抽樣誤差,,,,習(xí)題1:,有人說50~歲組患者的比重最高,該組患病最嚴(yán)重,60~歲后患病下降。此說法對(duì)嗎?為什么?,下列因素可能影響對(duì)比組之間的可比性: (1)觀察對(duì)象是否同質(zhì),研究方法是否相同,觀察時(shí)間是否相等,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 人群健康研究的統(tǒng)計(jì)學(xué)方法
- 醫(yī)學(xué)統(tǒng)計(jì)學(xué)定量資料的統(tǒng)計(jì)描述
- 醫(yī)學(xué)統(tǒng)計(jì)學(xué)-計(jì)數(shù)資料的統(tǒng)計(jì)描述
- 醫(yī)學(xué)統(tǒng)計(jì)學(xué)第4章-計(jì)數(shù)資料的統(tǒng)計(jì)描述
- 統(tǒng)計(jì)學(xué)教案習(xí)題06分類資料統(tǒng)計(jì)描述
- 統(tǒng)計(jì)學(xué)教案習(xí)題06分類資料統(tǒng)計(jì)描述
- [學(xué)習(xí)]統(tǒng)計(jì)學(xué)-分布數(shù)量特征的統(tǒng)計(jì)描述
- 統(tǒng)計(jì)學(xué)教案習(xí)題06分類資料統(tǒng)計(jì)描述x
- 統(tǒng)計(jì)學(xué)教案習(xí)題06分類資料統(tǒng)計(jì)描述x
- 第九篇_家庭禮儀
- 12_第九篇
- 統(tǒng)計(jì)學(xué)-計(jì)量資料
- 醫(yī)學(xué)統(tǒng)計(jì)學(xué)分類的統(tǒng)計(jì)描述
- 描述性統(tǒng)計(jì)學(xué)-universityofpittsburgh
- 描述性統(tǒng)計(jì)學(xué)公式
- 統(tǒng)計(jì)學(xué)--第九章直線回歸與相關(guān)
- 第九篇油漆涂料
- 第九篇 家庭禮儀
- 醫(yī)學(xué)統(tǒng)計(jì)學(xué)方法
- 描述統(tǒng)計(jì)學(xué)chap04
評(píng)論
0/150
提交評(píng)論