版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第三章 變異程度的統計描述,變異是生物醫(yī)學數據最顯著的特征。,掌握:描述數據分布離散趨勢的指標;正態(tài)分布的概念和特征、標準正態(tài)分布下面積分布規(guī)律。熟悉:醫(yī)學參考值范圍的意義和計算;了解:正態(tài)分布表、正態(tài)分布的應用。,學習目的和要求,描述數值變量資料的分布特征必須從集中趨勢和離散趨勢兩方面來進行,缺一不可。例: 三組同年齡女大學生體重(kg)如下,試分析其分布特征。 甲組 46 48 51
2、 53 57 =51 乙組 44 47 52 55 57 =51 丙組 45 49 50 55 56 =51,R=11,R=13,R=11,一、極差和四分位數間距(一)極差(range)R,也稱全距。例:甲、乙兩人高血壓患者測量5天的收縮壓(mmHg)得: 甲 1
3、62 145 178 142 186 =162.6 乙 164 160 163 159 166 =162.4,第一節(jié) 衡量變異程度的指標,R甲=186-142=44 R乙=166-159=7,四分位數間距(quartile interval,Q)就是上四分位數QU(即P75)與下四分位數間距QL(即P25)之差。其間包含了全部觀察
4、值的一半,單位與原觀察值相同。 四分位數間距越大,則數據的變異度越大;反之,說明變異度越小。,(二)四分位數間距(quartile)Q,,,,,0 25 50 75 100,,,,,,,四分位數間距與中位數一起可全面描述偏態(tài)分布資料的分布特征。,Q=135.7-63.2=72.5(mg/dl),例2.4 某地630名正常女性血清甘油三酯含量的頻數表甘油三酯(mg/dl) 頻數 累積頻數
5、累積頻率?。?) (2) ?。?) (4) 10~ 27 27 4.3 40~ 169 196 31.1 70~ 167 363
6、57.6 100~ 94 457 72.5 130~ 81 538 85.4 160~ 42 580
7、 92.1 190~ 28 608 96.5 220~ 14 622 98.7 250~ 4
8、 626 99.4 280~ 3 629 99.8 310~ 1 630 100.0 合計 630 ?。 ?-,,,,,(一)平均
9、偏差(mean difference),二、離均差平方和、方差、標準差和變異系數,例:,對甲乙兩名高血壓患者連續(xù)觀察5天,測得的收縮圧分別為:甲患者(mmHg) 162 145 178 142 186 =162.6乙患者(mmHg) 164 160 163 159 166 =162.4,甲患者的血壓波動較乙患者大。,平均偏差是一個很直觀的變異度量,但由于使用了絕對值,在數學上不便于繼續(xù)處理,使它在應用上受到
10、很大的限制,實際中很少使用。為了克服平均偏差使用絕對值不便進一步運算的缺點,可以不通過取絕對值,而是通過取平方來避免正負抵消,即使用離均差平方和。,(二)離均差平方和(sum of square, SS),,,,(三)方差與標準差(variance, standard deviation,S 或SD),,,,,N-1 稱自由度Degree of freedom,,例3.1 對甲乙兩名高血壓患者連續(xù)觀察5天,測得的收縮壓分別為:,甲
11、患者(mmHg) 162 145 178 142 186 =162.6乙患者(mmHg) 164 160 163 159 166 =162.4甲患者:ΣX=162+145+178+142+186=813 Σ X2=1622+1452+... + 1862=133713甲乙,大樣本頻數表資料可用下列公式計算標準差:,例3.2 根據第2章表2-2資料計算其標準差,紅細胞數 組中
12、值(x) 頻數(f) fx fx2 (1) (2) (3) (4)=(2)(3) (5)=(2)(4) 3.80~ 3.90 2 7.80 30.42 4.00~ 4.10 6 24.60 100.86 4
13、.20~ 4.30 11 47.30 203.39 4.40~ 4.50 25 112.50 506.25 4.60~ 4.70 32 150.40 706.88 . .
14、 . . . 5.80~ 5.90 1 5.90 34.81 合計 140 669.80 3224.20,,,,,(×1012/L),在所有的變異指標中,標準差或方差是其它變異
15、指標所不能比擬的。標準差能夠直接用于代數運算,如根據來自總體的幾個樣本的標準差可以直接求得合并樣本的標準差,而不必根據合并樣本重新計算。,計量資料的主要描述性指標及其適用條件,主要指標 適用條件 、s 對稱分布、正態(tài)或近似正態(tài)分布資料G、lg-1Slgx 等比級數或對數正態(tài)分布資料 M、Q 偏態(tài)分布、分布不明或分布末端無確
16、 定值的資料,,,,用標準差比較兩個樣本的變異程度時需注意:,1. 兩組數據的均數相差不大2. 單位相同(標準差使用的度量衡單位與 原始數據相同),(五)變異系數(coefficient of variation,CV),例3.3 已知:舒張壓均數為77.5 標準差為10.7 收縮壓均數為122.9 標準差為17.1舒張壓,可見兩種指標的變異度幾乎沒有什么差
17、別。,收縮壓,例7.10 某地調查110名20男大學生,其身高均數為172.73cm,標準差為4.09cm;其體重均數為55.04kg,標準差為4.10kg,試比較兩者變異程度。,身高,體重,指高峰位于中央(均數所在處)、兩測逐漸降低且左右對稱、不與橫軸相交的光滑的曲線。,以某地140名正常男子紅細胞數資料為例:,第二節(jié) 正態(tài)分布及其應用,正態(tài)分布曲線:,表2-2 某地140名正常男子紅細胞數的頻數表,紅細胞數 劃記
18、 組中值 頻數 頻率 (1)?。?) (3) ?。?) (5) 3.80~ T 3.90 2 1.4 4.00~ 正一 4.10 6 4.3 4.20~ 正正一 4.30
19、 11 7.9 4.40~ 正正正正正 4.50 25 17.9 4.60~ 正正正正正正T 4.70 32 22.9 4.80~ 正正正正正 T 4.90 27 19.3 5.00~
20、 正正正T 5.10 17 12.1 5.20~ 正正 T 5.30 13 9.3 5.40~ 5.50 4 2.9 5.60~
21、 T 5.70 2 1.4 5.80~6.00 一 5.90 1 0.7,,,,,,,若橫坐標為紅細胞數(變量值X),第i組的組距和人數分別用△Xi和fi表示,則在( X,X+△Xi )區(qū)間內每單位紅細胞數的頻率為:
22、 f(X)稱作密度函數 將前圖表示人數的縱坐標換成f(X)后可以得到下圖:,,矩形面積等于紅細胞在這一區(qū)間內出現的頻率,,,,正態(tài)分布的密度函數:,在 μ 和 σ 未知的情況下,可用 和S作為 μ 和σ 的估計值。,-∝< x < ∝,正態(tài)分布的幾個特征,以均值μ為中心,左右對稱曲線下的面積集中在以均數為中心的部分,越遠離中心,曲線下面積越小。正態(tài)曲線下面積分布有一定規(guī)律: 范圍內的面積為6
23、8.3% 范圍內的面積為95.0% 范圍內的面積為99.0%正態(tài)分布有兩個參數,μ和σ,,,,,,,,二、標準正態(tài)分布,(Standard normal distribution)是均數為0,標準差為1的正態(tài)分布。 對任何參數μ和σ的正態(tài)分布,都可以通過一個簡單的變量變化轉成標準正態(tài)分布,即,標準正態(tài)分布的密度函
24、數,,-?。紆<,分布函數求標準正態(tài)曲線下的面積。,標準正態(tài)分布的分布函數,,,當均數為0,標準差為1時,,,,,例如: 成年男子紅細胞數近似服從正態(tài)分布,均數為4.78 (×1012/L) ,標準差為0.38 (×1012/L) ?,F想知道紅細胞數在4× 1012/L以下所占的比例?,一旦完成了這種變換,就可以利用標準正態(tài)分布表求出與原始變量X有關的概率值。,可以先將變換為相應的u值,即:
25、,例:已知均數為4.78,標準差為0.38,,查附表1(P194),標準正態(tài)曲線下左側尾部面積,得Φ(-2.05)=0.0202,即在4×1012/L以下者占總人數的2.02%。,若需要求出在4×1012/L~5.5×1012/L范圍內所占的比例,可以通過下面計算獲得。,總體平均數,總體標準差,即在4×1012/L ~5.5×1012/L范圍內占總人數的95.04%。,,例:成年男子紅細
26、胞數近似服從正態(tài)分布,均數為4.78 (×1012/L) 標準差為0.38 (× 1012/L) ,現想知道紅細胞數在4×1012/L~5.5×1012/L范圍內所占的比例。,第一步:進行U變換,第二步:查附表1,標準正態(tài)分布曲線下面積。,Φ(-2.05)=0.0202,Φ(-1.89)=0.0294,(1.89查不到),正態(tài)分布的應用,是各種統計推斷方法的理論基礎可進行醫(yī)學參考值范圍的估計可
27、進行誤差分析和檢測的質量控制,第三節(jié) 醫(yī)學參考值范圍,醫(yī)學參考值范圍(refrence value range)又稱正常值范圍(normal range)。指正常人的解剖、生理、生化、免疫及組織代謝產物的含量等各種數據的波動范圍。,一、醫(yī)學參考值范圍的概念,1、臨床實踐:著眼于個體,作為劃分正常人與異常人的界線。2、預防醫(yī)學實踐:著眼于群體,如評價兒童的發(fā)育水平。,參考值范圍的應用:,二、醫(yī)學參考值范圍的制定方法,1. 選擇足
28、夠數量的正常人作為參照樣本2. 對選定的正常人進行準確的測定3. 決定取單側范圍還是雙側范圍值4. 選擇適當的百分范圍5. 選擇適當的方法估計參考值范圍的界限,,,,青光眼病人和正常人眼內壓分布圖,,,,,受檢人數,正常人,患者,,,,14 16 18 20 22 24 26 28 30 32 34 36 38,,,,眼內壓,,,,,,,,,,,,重疊區(qū),,,若將眼內壓的陽性診
29、斷標準定為22mmHg,所有患者均被判為陽性。但是,眼內壓在22-26mmHg之間的正常人被誤判為陽性(假陽性),造成誤診。,若將眼內壓的陽性診斷標準定為26mmHg,所有的正常人均被判為陰性。但是,眼內壓在22-26mmHg之間的患者被誤判為陰性(假陰性),造成漏診。,,表3-2 參考值范圍所對應的百分位數,百分范圍(%) 單側 雙側(對稱)
30、 下限 上限 下限 上限 95 P5 P95 P2.5 P97.5 99 P1 P99 P0.5 P99.5 表
31、3-3 參考值范圍所對應的正態(tài)分布區(qū)間 百分范圍(%) 單側 雙側(對稱) 下限 上限 下限 上限 95 -1.645s +1.645s -1.96s +1.96s 99
32、 -2.33s +2.33s -2.58s +2.58s,,,,,,,,,,,,醫(yī)學參考值計算方法,1. 正態(tài)分布法 適用于正態(tài)或近似正態(tài)分布資料 雙側界值: 單側上界: 單側下界:,求:該地成年男子紅細胞數的95%參考值范圍。,下限:,上限:,例:已知,2. 對數正態(tài)分布法 適用于對數正態(tài)分布資料 雙側界值: 單
33、側上界: 單側下界:3. 百分位數法 常用于偏態(tài)分布資料 雙側界值: P2.5和 P97.5 單側上界: P95 單側下界: P5,,例:第二章表2-4資料。估計血清甘油三酯含量的95%單側參考值范圍,例2.4 某地630名正常女性血清甘油三酯含量的頻數表甘油三酯(mmol/L) 頻數 累積頻數 累積頻率?。?) ?。?) ?。?) (
34、4) 0.10~ 27 27 4.3 0.40~ 169 196 31.1 0.70~ 167 363 57.6 1.00~ 94
35、 457 72.5 1.30~ 81 538 85.4 1.60~ 42 580 92.1 1.90~ 2
36、8 608 96.5 2.20~ 14 622 98.7 2.50~ 4 626 99.4 2.80~
37、 3 629 99.8 3.10~ 1 630 100.0 合計 630 ?。 ?-,,,,,,不同方法比較:正態(tài)分布法:資料必須服從正態(tài)或近似正態(tài)分布。特點:是結果比較穩(wěn)定,在樣本含量不是很大
38、的情況下(n<100)仍然能夠處理;百分位數法:不符合正態(tài)分布法或對數正態(tài)分布法的資料。特點:適用范圍較廣,故在實際中較為常用。但因兩端數據波動較大,使用百分位數法必須有較大樣本含量,否則結果不穩(wěn)定。,,例 8-11 某年某市調查了200例正常成人血鉛含量(?g/100g)如下,試估計該市成人血鉛含量95%醫(yī)學參考值范圍。,200個血鉛測量值,組段 頻數f 3~
39、 36 8~ 39 13~ 47 18~
40、 20 23~ 18 28~ 16 33~ 3
41、 38~ 7 43~ 1 48~ 1
42、 53~ 1 58~62 1,,,,200名血鉛頻數表,組段 頻數f 累計頻數?f 累計頻率(%)3~ 3
43、6 36 18.08~ 39 75 37.513~ 47
44、 122 61.0 18~ 20 152 76.023~ 18 170
45、 85.028~ 16 186 93.033~ 3 189
46、 94.538~ 7 196 98.043~ 1 197 98.548~
47、 1 198 99.053~ 1 199 99.558~62 1
48、 200 100.0,,,,200名血鉛頻數表及P95計算表,求95%的單側上界:,對數組段 頻數f 組中值(lgX) flgX f(lgX)20.45~ 1 0.5
49、0.5 0.250.55~ 5 0.6 3.0 1.800.65~ 10 0.7 7.0 4.900
50、.75~ 20 0.8 16.0 12.800.85~ 11 0.9 9.9 8.910.95~
51、 21 1.0 21.0 21.01.05~ 29 1.1 31.9 35.091.15~ 25
52、 1.2 90.0 36.01.25~ 30 1.3 39.0 50.71.35~ 20 1.4
53、 28.0 39.21.45~ 16 1.5 24.0 36.01.55~ 8 1.6 12.8
54、20.481.65~ 3 1.7 5.1 8.671.75~1.84 1 1.8 1.8 3.24合計
55、 200 230.0 279.04,,,,,200名血鉛值對數變換后的頻數表及 lgX、SlgX計算表,39.278(?g/100g),,5.08~39.28,掌握:描述數據分布離散趨勢的指標;正態(tài)分布的概念和特征、標準正態(tài)分布下面積分布規(guī)律。熟悉:醫(yī)學參考值范圍的意義和計算;了解:正態(tài)分布表、
56、正態(tài)分布的應用。,學習目的和要求,例8-1 某地2002年132例55~58歲健康成人空腹血糖(mmol/L)測定值資料如下: 5.17 5.56 4.86 4.87 4.74 5.24 5.51 4.46 4.96 4.82 4.90 5.30 5.22 5.58 5.36 5.45 3.60 4.67 4.74 5.24 5.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 變異程度的統計描述
- 第3章-定性資料的統計描述-nxpowerlite
- 第1、2、3章-緒論、計量統計描述
- 第02章--計量資料的統計描述正式
- 醫(yī)學統計學第4章-計數資料的統計描述
- 概率統計第3章答案
- 02-第2章定量資料統計描述85頁
- 統計學第3章練習
- 六西格瑪系列之統計學-第2章描述性統計
- 軟硬程度描述
- 第3章 正態(tài)分布時的統計決策
- 第四章統計描述
- 長江大學統計學原理第四章第3節(jié)-標志變異指標
- 第1章第2節(jié):運動的描述
- 統計學第3、4章習題
- 統計學第二章描述
- 第1章 怎樣描述物體的運動 1.4 怎樣描述速度變化的快慢(共3課時第3課時)
- 第5章遺傳與變異
- 第五章計數資料的統計描述2013
- 第20章生物的遺傳和變異
評論
0/150
提交評論