版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、計量資料的統(tǒng)計描述,趙耐青復旦大學衛(wèi)生統(tǒng)計教研室,目錄,概述,統(tǒng)計圖表,統(tǒng)計指標,頻數(shù)表;頻數(shù)/頻率圖,集中趨勢;離散趨勢,,計量資料的統(tǒng)計描述,統(tǒng)計圖表,頻數(shù)表某市1995年110名7歲男童身高資料,,,統(tǒng)計圖表,頻數(shù)表的制作,確定組數(shù):不宜過多或過少,一般10組,確定組距:可等可不等; 一般等組距=極差/組數(shù); 本例組距=(134.5-110.2)/10=2
2、.43,實際取2,確定各組上下限(每個組段的起點和終點): 第一組包含最小值 組段不能重疊 每一組段都為半開半閉區(qū)間 最后一組應為閉區(qū)間 離散型資料的組段通常為一個取值,利用Stata產(chǎn)生頻數(shù)表,Excel文件:直接粘貼到Sta
3、ta軟件中求最大值和最小值的命令:su x 最小值為110.2,取最小區(qū)組的下限為110gen y=int((x-110)/2)*2)+110tab y注意:stata命令一般都是小寫英文字母,統(tǒng)計圖表,表2.1 110名7歲男童身高頻數(shù)分布,,,,統(tǒng)計圖表,連續(xù)變量,離散變量,以直方頂點的縱坐標(等距分組)或直方的面積大小(不等距分組)表示頻數(shù)的多少,以各直條的長短表示頻數(shù)的多少,,頻數(shù)分布圖,統(tǒng)計圖表,連續(xù)變量頻數(shù)分布圖
4、,,,,等距分組:橫軸表示觀察變量,縱軸表示每個橫軸組段的頻數(shù)。,統(tǒng)計圖表,連續(xù)變量頻數(shù)分布圖,,,,不等距分組:橫軸表示觀察變量取值,由于不等距分組會影響頻數(shù)描述,所以縱軸表示每個橫軸單位的頻數(shù)/組距,統(tǒng)計圖表,頻數(shù)表/圖的用途揭示資料分布類型:頻數(shù)圖較頻數(shù)表更直觀描述頻數(shù)分布的重要特征:集中趨勢與離散趨勢便于發(fā)現(xiàn)特大與特小的可疑值便于進一步計算統(tǒng)計指標和做統(tǒng)計處理,統(tǒng)計指標,集中趨勢描述算術均數(shù):簡稱均數(shù)總體均數(shù)μ,樣本
5、均數(shù)當數(shù)據(jù)對稱分布時,位于分布的中心,是頻數(shù)分布最集中的位置 直接法: 加權法: (一般適合頻數(shù)表資料),統(tǒng)計指標,集中趨勢描述幾何均數(shù)G適用于經(jīng)對數(shù)轉(zhuǎn)換后呈對稱分布的數(shù)據(jù),如醫(yī)學上的滴 (一般適合頻數(shù)表資料),統(tǒng)計指標,集中趨勢描述中位數(shù)將一組觀察值從小到大排列位置居中
6、的數(shù)適用于 任何分布的定量數(shù)據(jù) 不完全資料(開口資料):沒有確切最大值或最小值的資料當n為偶數(shù)時當n為奇數(shù)時,統(tǒng)計指標,集中趨勢描述中位數(shù)計算離散型變量:直接法連續(xù)型變量:借助頻數(shù)分布表以組中值代替公式中的X計算公式LM中位數(shù)所在組下限;iM中位數(shù)所在組的組距;fM中位數(shù)所在組的頻數(shù); 中位數(shù)所在組前一組的累積頻數(shù),統(tǒng)計指標,離散程度的描述極差極差(ran
7、ge):最大值-最小值 優(yōu)點:簡單明了 缺點:不能反映其它數(shù)據(jù)的變異 樣本量較大時極差也較大 不宜比較,統(tǒng)計指標,離散程度的描述四分位間距百分位數(shù)(percentile):位置指標第x百分位數(shù)Px:將所有數(shù)據(jù)從小到大排列后,處于第x百分位置的數(shù)值。中位數(shù)記為 P50。連續(xù)型變量,統(tǒng)計指標,離散程度的描述四分位間距上下四分位數(shù)(QU
8、、QL):第25百分位數(shù)和第75百分位數(shù)四分位間距P75-P25:上下四分位數(shù)之間的距離,包括了一半的數(shù)據(jù),越大表明離散程度越高 描述了50%數(shù)據(jù)的分布寬度比極差穩(wěn)定 四分位數(shù)范圍P25~P75(inter-quartile range)描述了50%數(shù)據(jù)分布的寬度反映分布的位置特征,統(tǒng)計指標,離散程度的描述方差方差variance :適用于對稱分布的資料總體方差 樣本方差離均差平方和:描述每個數(shù)據(jù)X相對于
9、 分布的集中程度;與樣本含量n有關,樣本含量不同時不宜直接比較),統(tǒng)計指標,離散程度的描述方差方差:相當于平均每個數(shù)據(jù)的離均差的平方;可用于不同樣本含量數(shù)據(jù)離散度的比較。自由度(degree of freedom):當 選定時n個X中能自由變動的X的個數(shù),統(tǒng)計指標,離散程度的描述標準差標準差(standard deviation),統(tǒng)計指標,離散程度的描述變異系數(shù)變異系數(shù)coefficiedt of variat
10、lion (CV) CV=標準差/均數(shù)×100%描述了數(shù)據(jù)的變異相對其平均水平的大小描述的是相對離散度無單位量綱比較度量衡單位不同資料的變異度比較均數(shù)相差懸殊資料的變異度,數(shù)據(jù)分析中的一般統(tǒng)計描述策略,如果資料近似呈對稱分布,則如果資料取對數(shù)后才呈對稱分布,則如果資料呈偏態(tài)分布在確認性研究中,往往統(tǒng)計描述采用均數(shù),中位數(shù),標準差, , ,最小值,最大值。,小
11、 結,集中趨勢指標:不同分布情況下,描述指標的選擇,離散趨勢指標:各個指標的應用和特點,如何從集中趨勢和離散趨勢兩個角度對數(shù)據(jù)進行合理的描述,STATA命令,等距分組頻數(shù)圖(例2.1)use 光盤符:\例題\ex2-1 打開數(shù)據(jù)庫文件ex2-1.dta gen f=int((x-110)/2)*2+110產(chǎn)生用以作頻數(shù)表的新變量“f”tab f對變量“f”作頻數(shù)表graph f,bin(13) freq作頻數(shù)圖,STAT
12、A命令,不等距分組頻數(shù)圖(例2.2)use 光盤符:\例題\ex2-2 打開數(shù)據(jù)庫文件ex2-2.dta graph num age, c (J) s(.) xlab (0 5 to 60) ylab(0 5 to 25) 作頻數(shù)圖,其中c(J),以階梯狀橫線連接各數(shù)據(jù)點。Xlab 和ylab為x軸和y軸的刻度,STATA命令,求均數(shù)、標準差(例2.1)use 光盤符:\例題\ex2-1 直接法
13、sum x 綜述變量x 間接法gen xx=int((x-110)/2)*2+111sum xx 綜述變量“xx”作頻數(shù)圖,STATA命令,求幾何均數(shù)(例2.5)use 光盤符:\例題\ex2-5 means x [w=f] 以f為權重變量,求變量x的平均數(shù) 求均數(shù)、中位數(shù)、四分位數(shù)范圍、標準差、方差、偏度系數(shù)、峰度系數(shù)(例2.6) use 光盤符\例題\ex2-6
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論