預(yù)防醫(yī)學(xué)]04抽樣誤差與假設(shè)檢驗(yàn)

上傳人：奔*** IP屬地：河北更新時間：2024-10-10 格式：ppt 頁數(shù)：46 大?。?.33MB 人氣指數(shù)：12 舉報 版權(quán)申訴

已閱讀1頁，還剩45頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第四章　抽樣誤差與假設(shè)檢驗(yàn),Sampling error & Hypothesis test,本章結(jié)構(gòu),均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤t分布總體均數(shù)的估計假設(shè)檢驗(yàn)的意義和步驟,均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤,Standard error,統(tǒng)計推斷(statistical inference),inference,抽樣誤差的概念,定義：由抽樣引起的樣本統(tǒng)計量與總體參數(shù)間、以及樣本統(tǒng)計量與樣本統(tǒng)計量之間的差別。原因：個體變異＋隨機(jī)抽

2、樣表現(xiàn)：樣本統(tǒng)計量與總體參數(shù)間的差別不同樣本統(tǒng)計量間的差別,假設(shè)一個已知總體，從該總體中抽樣，對每個樣本計算樣本統(tǒng)計量(均數(shù)、方差等)，觀察樣本統(tǒng)計量的分布規(guī)律－－抽樣分布規(guī)律。考察：不同的分布不同的樣本含量,抽樣試驗(yàn),從正態(tài)分布總體N（5.00,0.502）中，每次隨機(jī)抽取樣本含量n＝5，并計算其均數(shù)與標(biāo)準(zhǔn)差；重復(fù)抽取1000次，獲得1000份樣本；計算1000份樣本的均數(shù)與標(biāo)準(zhǔn)差，并對1000份樣本的均數(shù)作直方圖。

3、按上述方法再做樣本含量n＝10、樣本含量n＝30的抽樣實(shí)驗(yàn)；比較計算結(jié)果。,抽樣試驗(yàn)（n=5）,抽樣試驗(yàn)（n=10）,抽樣試驗(yàn)（n=30）,3個抽樣實(shí)驗(yàn)結(jié)果圖示,,樣本均數(shù)的抽樣分布特點(diǎn),各樣本均數(shù)未必等于總體均數(shù)；樣本均數(shù)之間存在差異；樣本均數(shù)的分布很有規(guī)律，圍繞著總體均數(shù)，中間多、兩邊少，左右基本對稱，也服從正態(tài)分布；樣本均數(shù)的變異較原變量的變異大大縮小。隨著樣本含量的增加，樣本均數(shù)的變異范圍逐漸縮小。,標(biāo)準(zhǔn)誤的概念(s

4、tandard error),樣本均數(shù)的標(biāo)準(zhǔn)差稱為均數(shù)的標(biāo)準(zhǔn)誤。均數(shù)的標(biāo)準(zhǔn)誤表示樣本均數(shù)的變異度。當(dāng)總體標(biāo)準(zhǔn)差未知時，用樣本方差代替，,標(biāo)準(zhǔn)誤的概念,抽樣的樣本量越大，標(biāo)準(zhǔn)誤就越??；原來總體變異度小，標(biāo)準(zhǔn)誤就越小。標(biāo)準(zhǔn)誤反映了樣本均數(shù)間的離散程度，也反映了樣本均數(shù)與總體均數(shù)之間的差異。當(dāng)標(biāo)準(zhǔn)誤大時，用樣本均數(shù)對總體均數(shù)的估計的可靠程度就小；反之亦然。,標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤,意義：標(biāo)準(zhǔn)差用于描述個體值之間的變異，即觀察值間的

5、離散度，標(biāo)準(zhǔn)差小，表明觀察值圍繞均數(shù)的波動??；標(biāo)準(zhǔn)誤描述統(tǒng)計量的抽樣誤差，即樣本統(tǒng)計量與總體參數(shù)的接近程度。標(biāo)準(zhǔn)誤小，表明抽樣誤差小，則統(tǒng)計量穩(wěn)定，與參數(shù)接近。用途：標(biāo)準(zhǔn)差表示觀察值間波動的大小，用于醫(yī)學(xué)參考值范圍；標(biāo)準(zhǔn)誤表示抽樣誤差的大小，用于參數(shù)估計。關(guān)系：隨著樣本含量增加，都減小。聯(lián)系：都是表示變異度的指標(biāo)，當(dāng)樣本量一定時，兩者成正比。,中心極限定理(central limit theorem),中心極限定理(centr

6、al limit theorem),t-分布,t-distribution,t 分布的概念,用樣本方差代替總體方差，此時不再服從正態(tài)分布。而服從 t 分布。記為：,t分布曲線,t 分布有如下性質(zhì)：①單峰分布，曲線在t＝0 處最高，并以t＝0為中心左右對稱②與正態(tài)分布相比，曲線最高處較矮，兩尾部翹得高（見綠線）③ 隨自由度增大，曲線逐漸接近正態(tài)分布；分布的極限為標(biāo)準(zhǔn)正態(tài)分布。,t分布曲線下面積（附表2）,雙側(cè)t0.05/2，9＝

7、2.262 ＝單側(cè)t0.025，9單側(cè)t0.05，9＝1.833雙側(cè)t0.01/2，9＝3.250 ＝單側(cè)t0.005，9單側(cè)t0.01，9＝2.821雙側(cè)t0.05/2，∞＝1.96 ＝單側(cè)t0.025，∞單側(cè)t0.05，∞ ＝1.64,總體均數(shù)的估計,Parameter estimation,總體均數(shù)估計方法,區(qū)間估計（interval estimation),也稱置信區(qū)間。利用樣本信

8、息給出一個區(qū)間，并同時給出按預(yù)先給定的概率估計該區(qū)間包含總體均數(shù)的可能范圍。,可信度：給定的概率稱為可信度。用表示。通常取99%、95%。,t分布方法,應(yīng)用條件：總體方差未知，樣本量小,例4.2 某醫(yī)師側(cè)的40名老年性慢性支氣管炎病人尿中17-酮類固醇排出量均數(shù)為15.19umol/d，標(biāo)準(zhǔn)差為5.03umol/d，試估計該種病人尿17-酮類固醇排出量總體均數(shù)的95%可信區(qū)間。,分析條件：總體方差未知，樣本量小,正態(tài)分

9、布近似法,,應(yīng)用條件：當(dāng)總體標(biāo)準(zhǔn)差已知時；或總體標(biāo)準(zhǔn)差未知，而樣本量較大時（n>50),例4.3 某市隨機(jī)抽查12歲男孩100人，得身高均數(shù)139.6cm，標(biāo)準(zhǔn)差6.85cm。計算該地12歲男孩身高均數(shù)的95%的可信區(qū)間。,分析條件：總體方差未知，但樣本量大，用正態(tài)分布法,95％可信區(qū)間：從總體中作隨機(jī)抽樣，作100次抽樣，每個樣本可算得一個可信區(qū)間，得100個可信區(qū)間，平均有95個可信區(qū)間包括μ(估計正確)，只有5個可信區(qū)間

10、不包括μ(估計錯誤)。,可信區(qū)間的涵義,可信度實(shí)驗(yàn),可信區(qū)間的兩個基本要素,準(zhǔn)確度：可信區(qū)間包含總體均數(shù)的概率。精密度：反映區(qū)間的長度。,假設(shè)檢驗(yàn),Hypothesis test,讓我們先看一個例子.,例4.4 根據(jù)大量調(diào)查，已知健康成年男子的脈搏均數(shù)為72次/分。某醫(yī)生在某山區(qū)隨機(jī)調(diào)查30名健康男子，求得脈搏均數(shù)為74.2次/分，標(biāo)準(zhǔn)差為6.5次/分。能否認(rèn)為該山區(qū)的成年男子的脈搏均數(shù)高于一般成年男子的脈搏均數(shù)？,對差別的可能原

11、因分析,山區(qū)男子脈搏的總體均數(shù)與一般成年男子的脈搏均數(shù)相等，差異是由抽樣誤差引起的——提示山區(qū)男子是一般男子總體的一部分（研究總體）。山區(qū)男子脈搏的總體均數(shù)與一般成年男子的脈搏均數(shù)不相等，差異可能是由地域等因素引起的——提示山區(qū)男子與一般男子是兩個不同的總體。,假設(shè)檢驗(yàn)——通過對假設(shè)作出取舍抉擇來達(dá)到解決問題的目的A.山區(qū)男子脈搏的總體均數(shù)與一般成年男子的脈搏均數(shù)相等無差異假設(shè)、零假設(shè) H0（null hypo

12、thesis）B.山區(qū)男子脈搏的總體均數(shù)與一般成年男子的脈搏均數(shù)不相等對立假設(shè)、備擇假設(shè)H1（alternative hypothesis）,證明A還是證明B？在H0成立的條件下，均數(shù)之間的差異是由抽樣誤差引起的，有規(guī)律可循；在H1成立的條件下，均數(shù)間的不同包含種種未知情形，無規(guī)律可循。故從H0成立的角度出發(fā)，尋求其成立的概率。,變量值（脈搏）X服從正態(tài)分布，且為小樣本，假定H0成立，樣本均數(shù)服從t-分布，則

13、　在H0成立的前提下，當(dāng)前t值出現(xiàn)的概率有多大？？？,如何給出這個量的界限？,小概率事件在一次試驗(yàn)中基本上不會發(fā)生！,從附表2中查出在顯著性水平=0.05（雙側(cè)），自由度為２９所對應(yīng)的t界值，即為拒絕域與接受域的界限。如果計算出的t統(tǒng)計量大于相應(yīng)的t界值，則落在拒絕域中，該統(tǒng)計量出現(xiàn)的概率小于5%，為小概率事件。,常取,的選擇要根據(jù)實(shí)際情況而定,通常取0.05,檢驗(yàn)水準(zhǔn)的概念,在假設(shè)檢驗(yàn)中，稱預(yù)先規(guī)定的小概率值為檢驗(yàn)水準(zhǔn)，也稱為顯著

14、性水準(zhǔn)，用　表示。,這里所依據(jù)的邏輯是：,如果H0 是成立的，那么衡量差異大小的某個統(tǒng)計量落入?yún)^(qū)域拒絕域是個小概率事件。如果該統(tǒng)計量的實(shí)測值落入拒絕域，也就是說， H0 成立下的小概率事件發(fā)生了，那么就認(rèn)為H0不可信而否定它。否則我們就不能否定H0 （只好接受它）.,1. 建立檢驗(yàn)假設(shè)，確定檢驗(yàn)水準(zhǔn)； H0：零假設(shè)、無效假設(shè)。是與研究假設(shè)有關(guān)的、被推斷特征某種確定的關(guān)系； H1：備擇假設(shè)、對立假設(shè)。是被推斷總體特征的另

眾賞文庫> 全部分類> 畢業(yè)設(shè)計

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

預(yù)防醫(yī)學(xué)]04抽樣誤差與假設(shè)檢驗(yàn)

文檔簡介

溫馨提示

最新文檔

評論

預(yù)防醫(yī)學(xué)]04抽樣誤差與假設(shè)檢驗(yàn)

文檔簡介

溫馨提示

最新文檔

評論

免費(fèi)下載