2023年全國(guó)碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩39頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1,第三篇 醫(yī)學(xué)統(tǒng)計(jì)學(xué)方法,,Statistical Methods in Medicine,2,第九章 數(shù)值變量資料的統(tǒng)計(jì)分析第一節(jié) 數(shù)值型資料的統(tǒng)計(jì)描述第二節(jié) 正態(tài)分布和參考值范圍的估計(jì)第三節(jié) 數(shù)值型資料的統(tǒng)計(jì)推斷第四節(jié) t檢驗(yàn)和u檢驗(yàn)第五節(jié) 方差分析,3,4,統(tǒng)計(jì)分析包括統(tǒng)計(jì)描述和統(tǒng)計(jì)推斷兩大部分。統(tǒng)計(jì)描述(statistical description)是用統(tǒng)計(jì)指標(biāo)、統(tǒng)計(jì)表和統(tǒng)計(jì)圖

2、描述資料的分析規(guī)律及其數(shù)量特征;統(tǒng)計(jì)推斷(statistical inference) 包括總體參數(shù)估計(jì)和假設(shè)檢驗(yàn)兩個(gè)內(nèi)容。 參數(shù)估計(jì):是用樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)所在范圍。 假設(shè)檢驗(yàn):是利用樣本的實(shí)際資料來檢驗(yàn)事先對(duì)總體某些數(shù)量特征所作的假設(shè)是否成立。,5,第一節(jié) 數(shù)值型變量資料的統(tǒng)計(jì)描述例9.1 2002年某市150名20~29歲正常男子的尿酸濃度(μmol/L) ,資料見表9-1。如何進(jìn)行統(tǒng)計(jì)描述?,6,表9

3、-1 2002年某市150名20~29歲正常男子的尿酸濃度(μmol/L),7,統(tǒng)計(jì)描述的內(nèi)容:一、制頻數(shù)(分布) 表(表9-2)和頻數(shù)分布圖(圖9-1) 頻數(shù)表的用途(1) 揭示資料的分布特征和分布類型(2) 便于發(fā)現(xiàn)某些特大或特小的可疑值(3) 便于進(jìn)一步計(jì)算統(tǒng)計(jì)指標(biāo)和統(tǒng)計(jì)分析處理二、計(jì)算統(tǒng)計(jì)指標(biāo)(1) 計(jì)算平均值—代表一組資料的平均水平;(2) 計(jì)算標(biāo)準(zhǔn)差---反映資料的離散程度。三、繪制統(tǒng)計(jì)表和

4、統(tǒng)計(jì)圖,8,一、編制頻數(shù)分布表:制表步驟:(1)求極差或全距(range):R=Xmax - Xmin 本例, R=428.7-278.6=150.1(μmol/L)。(2)決定組數(shù)、組段數(shù)和劃分組距(class interval):根據(jù)樣本含量的多少確定組數(shù),一般設(shè)8~15組。組段數(shù)=取整(極差/組數(shù))。本例:組段數(shù)=取整(150.1/10)=15.01?15劃分組距:每組段的起點(diǎn)和終點(diǎn)分別稱為下界和上界。組距:本組內(nèi)

5、的上界和下界之差。,9,(3)列頻數(shù)表:按上述組段序列制成表的形式,采用劃記法或計(jì)算機(jī)將原始數(shù)據(jù)匯總,得出各組段中所包含的觀察例數(shù),即為頻數(shù),如表9-2的第 (2)欄。將各組段及其相應(yīng)的頻數(shù)列成表格,即為頻數(shù)表(frequency table),如表9-2。所繪的圖形見圖9-1。,10,資料的分布類型: 對(duì)稱分布或正態(tài)分布;2. 偏態(tài)分布:高峰在左側(cè)或右側(cè);3. 不規(guī)則分布:分布很散,無明顯高峰,11,二、計(jì)算平均值—代表平均資

6、料的平均水平1.平均值的種類:(一) 算術(shù)均值(arithmetic mean,average):常用  表示樣本均值,希臘字母μ表示總體均值。適用于對(duì)稱分布的數(shù)值型變量資料。  其計(jì)算方法有: ①直接法: χi (I=1,2,…,n)為第i個(gè)觀察對(duì)象的觀察值,②加權(quán)法: χi 為第i組的組中值, fi 為第i組的例數(shù):,12,13,(二) 幾何均值(geometric mean,G)適用條件: 等比級(jí)數(shù)資料. 原始

7、觀察值呈偏態(tài)分布、但數(shù)據(jù)經(jīng)過對(duì)數(shù)變換后呈正態(tài)分布或近似正態(tài)分布的資料。如醫(yī)學(xué)實(shí)踐中某些疾病的潛伏期、抗體滴度、平均效價(jià)等。其計(jì)算方法有:①直接法: χi 為第i個(gè)觀察對(duì)象的觀察值,②加權(quán)法: χi 為第i組的組中值(或觀察值), fi 為第i組例數(shù):,14,表9-4 某地34名兒童接種麻疹疫苗后血清血凝抑制抗體滴度,血清血凝抑制抗體的幾何平均滴度為1:10.206。X=(2.5×3+5.0 ×7+10.0&

8、#215;14+20.0 ×6+40.0 ×4)/34=13.6 (算術(shù)平均滴度為1:13.6),,15,(三) 中位數(shù)(median, M): 將觀察值按大小排序后,位次居中的觀察值。M=X(P=50%)在全部觀察值中小于M的觀察值個(gè)數(shù)與大于M的觀察值個(gè)數(shù)相等。由于M不受個(gè)別特小或特大觀察值的影響,適用于分布不規(guī)則或分散度很高的資料.3個(gè)觀察值:1,3,5. M=3; 4個(gè)觀察值:1,3,5

9、,7. M=4.①直接法: 設(shè)n 為觀察值的個(gè)數(shù),有公式(9-5)及(9-6),②頻數(shù)表法: χi 為第i組的組中值(或觀察值), fi 為第i組例數(shù):,L:中位數(shù)組段下限值,ΣfL:小于L的累計(jì)頻數(shù),i:中位數(shù)組距.,16,表9-5 308名6歲以下兒童尿鉛值的頻數(shù)分布(中位數(shù)計(jì)算),L: 中位數(shù)組段下限值,ΣfL:小于L的累計(jì)頻數(shù),i: 中位數(shù)組距,f50%:中位數(shù)組頻數(shù).L=50, ΣfL=81, i=25

10、f50%=95,17,三、計(jì)算標(biāo)準(zhǔn)差---反映資料的離散程度。數(shù)值變量數(shù)據(jù)的頻數(shù)分布有集中趨勢(shì)和離散程度兩個(gè)主要特征,只有兩者相結(jié)合,才能全面地認(rèn)識(shí)事物。反映資料的離散程度的統(tǒng)計(jì)量(統(tǒng)計(jì)指標(biāo))有:(一) 全距(range)或極差:R=Xmax - Xmin全距是一組觀察值中最大值與最小值之差。(二) 四分位數(shù)間距(quartile interval): Q=X75%—X25% , Q包括了全部觀察值中間的一半.(三)

11、方差(variance)和標(biāo)準(zhǔn)差(standard deviation),18,例 有3組同齡男孩的體重(㎏)測(cè)量值如下,其平均體重都是30 (㎏) ,試分析其離散程度。,,(㎏),19,標(biāo)準(zhǔn)差的簡(jiǎn)化計(jì)算方法:數(shù)學(xué)上可證明:,故標(biāo)準(zhǔn)差的計(jì)算公式又可寫成:直接法: X為觀察值 加權(quán)法:Xi為組中值,20,標(biāo)準(zhǔn)差的應(yīng)用:(1)表示觀察值的變異程度(離散程度): 在兩組(或幾組)資料均數(shù)相近、度量單

12、位相同的條件下,標(biāo)準(zhǔn)差大,表示觀察值的變異度大,即各觀察值離均數(shù)較遠(yuǎn),均數(shù)的代表性較差。(2)結(jié)合均數(shù)描述正態(tài)分布的特征和估計(jì)醫(yī)學(xué)參考值范圍。(3)結(jié)合樣本含量n計(jì)算標(biāo)準(zhǔn)誤。,21,四分位數(shù)間距的計(jì)算(interquartile range,Q):中位數(shù)計(jì)算公式: 25%位數(shù)計(jì)算公式:,75%位數(shù)計(jì)算公式,22,四分位數(shù)間距(interquartile range,Q)計(jì)算公式: Q = X75% – X25%,,X0%

13、 X25% X50% X75% X100% | Q |,,,,,,,0 48.15 69.21 100.0 175~X1

14、 … Xn,,23,24,變異系數(shù)(coefficient of variation,CV): 若比較度量單位不同或均數(shù)相差懸殊的兩組(或幾組)觀察值的變異度,則需用變異系數(shù)為相互比較的指標(biāo)。不屬于描述性統(tǒng)計(jì)指標(biāo),是一個(gè)比較用的統(tǒng)計(jì)指標(biāo)。,從變異系數(shù)比較,體重的變異程度大于身高的變異程度。變異系數(shù)的特點(diǎn):描述的是相對(duì)離

15、散程度,沒有單位。適用于:(1) 比較單位不同的多組資料的變異度。 (2) 比較均數(shù)相差懸殊的多組資料的變異度。,例9-10 某地25歲男子100人的調(diào)查結(jié)果如下:?jiǎn)栴}:哪一個(gè)指標(biāo)的變異度大些?,25,第二節(jié) 正態(tài)分布和醫(yī)學(xué)參考值范圍一、正態(tài)分布(normal distribution),,26,圖9-2 頻數(shù)分布逐漸向正態(tài)分布接近,27,(一)正態(tài)分布的圖形可以設(shè)想,如果觀察例數(shù)逐漸增

16、多,組段數(shù)也不斷增多,就會(huì)形成一條光滑曲線[圖9-2(3)]。稱為正態(tài)分布曲線。這條正態(tài)分布曲線的特點(diǎn)為:①高峰位于中央均數(shù)所在處、兩側(cè)逐漸降低;②左右對(duì)稱; ③曲線在無窮遠(yuǎn)處與橫軸相交。把服從正態(tài)分布的變量表示為: X~N(μ,σ2),正態(tài)分布曲線由兩個(gè)參數(shù)確定:①平均數(shù)μ,稱位置參數(shù),決定平均數(shù)所在的位置;②方差σ2,稱形狀參數(shù),決定曲線的高低寬窄。,28,服從正態(tài)分布的變量X的概

17、率密度函數(shù)f(X)為,式中,μ為總體均數(shù);σ為總體標(biāo)準(zhǔn)差;π=3.14159為圓周率;e為自然對(duì)數(shù)的底(e≈2.71828), X為變量。,表示為:u~N(0,1),即平均值為0、方差為1的正態(tài)分布。,為實(shí)際應(yīng)用方便,將一般正態(tài)分布轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布。轉(zhuǎn)換公式為: u =(X-μ)/σ, u稱為標(biāo)準(zhǔn)正態(tài)變量。服從標(biāo)準(zhǔn)正態(tài)分布的變量u的概率密度函數(shù)f(u)為,29,A. 正態(tài)分布

18、 B. 標(biāo)準(zhǔn)正態(tài)分布圖9-3 正態(tài)分布與標(biāo)準(zhǔn)正態(tài)分布的面積與縱高,按式(9-16),根據(jù)X的不同取值,繪出正態(tài)分布(normal distribution)的圖形(圖9-3A)。按式(9-16),根據(jù)u的不同取值,繪出標(biāo)準(zhǔn)正態(tài)分布(standard normal distribution)的圖形(圖9-3B)。,X,u,30,圖9-4 正態(tài)曲線與標(biāo)準(zhǔn)正態(tài)曲線的面積分布,二、正態(tài)曲線下面積的分布規(guī)律:用積分法求得。,

19、31,為了省去計(jì)算的麻煩,編制成了“標(biāo)準(zhǔn)正態(tài)分布曲線下的面積”(表9-8)。表中列出了左側(cè)概率:Φ(-∞,-u);右側(cè)概率:Φ(u,+∞)=Φ(-∞,-u) ,Φ(-∞,u)=1-Φ(-∞,-u) 通過查表可求出正態(tài)曲線下某區(qū)間的面積,進(jìn)而估計(jì)該區(qū)間觀察例數(shù)占總例數(shù)的百分?jǐn)?shù)或變量值落在該區(qū)間的概率。,查表時(shí)應(yīng)注意:①當(dāng)μ, σ已知時(shí),先將觀察值X變換為u值[u=(X-μ)/σ],再查表;②當(dāng)μ,σ未知、但n足夠大時(shí),可以用樣本均

20、數(shù) 和樣本標(biāo)準(zhǔn)差s分別代替μ和σ,進(jìn)行u變換[u=(X- )/s]求得u的估計(jì)值后再查表;③曲線下對(duì)稱于0的區(qū)間面積相等,如 Φ(-∞,-1.96)= Φ(1.96,∞)④曲線下橫軸上的總面積為100%或1。,.,32,三、醫(yī)學(xué)參考值范圍的估計(jì)㈠參考值范圍(reference range)的意義  參考值是指正常人體或動(dòng)物的各種生理常數(shù),正常人體液和排泄物中某種生理生化指標(biāo)或某種元素

21、的含量,以及人體對(duì)各種試驗(yàn)的正常反應(yīng)值等。由于存在個(gè)體變異,各種數(shù)據(jù)不僅因人而異,而且同一個(gè)人還會(huì)隨機(jī)體內(nèi)外環(huán)境的改變而改變,因而需要確定其波動(dòng)的范圍,即醫(yī)學(xué)參考值范圍,亦稱醫(yī)學(xué)正常值范圍。,33,制訂醫(yī)學(xué)參考值范圍時(shí)須注意:①從同質(zhì)總體中隨機(jī)抽樣。根據(jù)研究目的確定同質(zhì)總體的標(biāo)準(zhǔn)。排除患有影響所研究指標(biāo)的疾病和有關(guān)因素的同質(zhì)人群。②需要有一定的樣本含量。n≥100例。③控制測(cè)量誤差。④判斷是否需要分組確定參考值范圍。如不同性別

22、,不同年齡組,甚至不同民族。⑤確定是取單側(cè)還是取雙側(cè)參考值。⑥確定適當(dāng)?shù)陌俜謹(jǐn)?shù)范圍。80%,90%,95%,99%。范圍過窄,即診斷標(biāo)準(zhǔn)過嚴(yán),會(huì)增加漏診;范圍過寬,即診斷標(biāo)準(zhǔn)過松,會(huì)增加誤診; ⑦根據(jù)資料分布類型選擇統(tǒng)計(jì)學(xué)方法估計(jì)參考值范圍。,34,例9-11,表9-2 2002年某市150名20~29歲正常男子的尿酸濃度資料。X=350.24 (μmol/L), S=32.97(μmol/L).用正態(tài)分布法雙側(cè)95%的參考值范

23、圍的上下界限值為: 下界: 350.24-1.96×32.97=285.62 (μmol/L), 上界: 350.24 +1.96×32.97=414.86 (μmol/L)即20~29歲男性尿酸濃度95%參考值范圍:285.62~414.86 (μmol/L),35,例9-12,例9-7表9-5,308名6歲以下兒童尿鉛值資料。用百分位數(shù)法計(jì)算單側(cè)95%參考值范圍的

24、上界值。即X95%,L=150: 95%組段下限值ΣfL=291:小于L的累計(jì)頻數(shù)i=25: 95%組的組距f95%:=12:95%組頻數(shù),,故6歲以下兒童尿鉛值單側(cè)95%參考值范圍為: <153.33(mmol/L),36,37,The end,38,第九章 第一講《練習(xí)題》 實(shí)習(xí)九 數(shù)值變量資料的統(tǒng)計(jì)分析(1) pp.379-382 [內(nèi)容] (一)  選擇題:1,2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論