醫(yī)學統(tǒng)計學假設檢驗基礎_第1頁
已閱讀1頁,還剩85頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、假設檢驗基礎,,,,,總 體,樣 本,,統(tǒng)計描述,,,,統(tǒng)計推斷,隨機抽樣,假設檢驗的概念與原理假設檢驗的基本步驟t檢驗假設檢驗與區(qū)間估計的關(guān)系假設檢驗的功效,第一節(jié) 假設檢驗的概念與原理,例1 根據(jù)大量調(diào)查,已知健康成年男子的脈搏均數(shù)是72次/min,某醫(yī)生在山區(qū)隨機抽查25名健康成年男子,求得其脈搏均數(shù)為74.2次/ min,標準差為6.5次/ min ??煞駬?jù)此認為山區(qū)成年男子的脈搏均數(shù)與一般健康男性脈搏均數(shù)相同?

2、目的:推斷山區(qū)的健康成年男子脈搏均數(shù)(未知總體均數(shù)?)與一般健康成年男子脈搏均數(shù)(已知總體均數(shù)?0)間有無差別 μ =μ0 ?,顯然樣本均數(shù)與總體均數(shù)不等有兩種可能:1 由于抽樣誤差所致;2 由于環(huán)境因素的影響所致。如圖所示:,已知總體均數(shù)μ0,未知總體均數(shù)μ,,,,是由抽樣誤差所致,不僅僅是由抽樣誤差,兩總體存在本質(zhì)差異,,假設檢驗,如何判斷,假設檢驗的概念 (Hypothesis)  

3、先對未知總體進行兩種對立的假設,然后依據(jù)有限的樣本信息對未知總體的兩種對立假設進行抉擇的過程。,假設檢驗的基本思想小概率事件實際推斷原理  小概率事件在一次隨機試驗中不大可能發(fā)生,如果一次抽樣發(fā)生了小概率事件,就有理由懷疑前提假設的成立。反證法 提出一個假設,確定當此假設成立時獲得現(xiàn)在樣本的 概率大小,如果是小概率事件,則推斷假設是假的,拒絕它;如果不是,則認為假設是真的,不能拒絕它

4、,事件,,A,,B,肯定A,否定B,,,,,,(一) 建立假設,確定單雙側(cè)檢驗,建立假設 : 零假設或原假設(null hypothesis)、無效假設 通常為兩總體參數(shù)相等或服從某分布 樣本均數(shù)與總體均數(shù)不同是由于抽樣誤差所致 : 備擇假設(alternative hypothesis)、對立假設 通常為兩總體參數(shù)不相等或不服從某分布 樣本均數(shù)與總

5、體均數(shù)不同是由于存在本質(zhì)差別確定單雙側(cè)檢驗由研究目的及專業(yè)知識所決定從備擇假設看:,例如,在臨床試驗中,比較甲、乙兩種治療方法的療效是否有差異:如果只要求區(qū)分兩方法是否不同,無需區(qū)分何者為優(yōu),則應選用雙側(cè)檢驗。如果有充分的理由認為甲法療效不比乙法差,此時應選用單側(cè)檢驗。,選用雙側(cè)檢驗還是單側(cè)檢驗,應該在假設檢驗的第一步建立檢驗假設時確定,不應該在算得檢驗統(tǒng)計量后主觀確定,否則可能會得到相反結(jié)論。,例如,對同一份資料進行t檢驗,

6、如果雙側(cè)檢驗的t值等于0.06,根據(jù)t分布的對稱性,單側(cè)檢驗的t值就等于0.03。假定檢驗水準α=0.05,則雙側(cè)檢驗的結(jié)論是不拒絕H0 ,而單側(cè)檢驗的結(jié)論是拒絕H0 。,(二)確定檢驗水準,檢驗水準 :為預先規(guī)定的小概率事件的標準通常取值=0.05或0.01可根據(jù)研究目的進行調(diào)整,(三)選擇檢驗方法,計算檢驗統(tǒng)計量,應根據(jù)研究目的、資料類型、設計類型及樣本含量大小等因素選擇合適的假設檢驗方法;在 成立的前提下,由樣本已知信息構(gòu)造

7、檢驗統(tǒng)計量;通常根據(jù)構(gòu)造的檢驗統(tǒng)計量來命名假設檢驗方法。不同的統(tǒng)計量涉及的統(tǒng)計分布不同,(四)確定 P 值,P值的含義:由H0所規(guī)定的總體作隨機抽樣,獲得現(xiàn)有樣本統(tǒng)計量值及更極端值的概率怎樣確定P值:構(gòu)造的檢驗統(tǒng)計量服從相應的分布,查相應分布界值表確定P值。一般雙側(cè)檢驗查雙側(cè)界值表,單側(cè)檢驗查單側(cè)界值表。,(五)作出推斷結(jié)論,P與檢驗水準α相比作出推斷結(jié)論 P≤ α,拒絕H0,接受H1 差別有統(tǒng)計學意義(在H0成立的

8、前提下,一次隨機抽樣發(fā)生了小概率事件)P> α,不能拒絕H0 差別無統(tǒng)計學意義(在H0成立的前提下,一次隨機抽樣沒有發(fā)生了小概率事件,沒有充足的理由拒絕H0 ) 推斷結(jié)論應包括統(tǒng)計結(jié)論和專業(yè)結(jié)論,還必須結(jié)合專 業(yè)得出最終結(jié)論,,,1、H0:?=72,山區(qū)成年男子的脈搏均數(shù)與一般健康男性脈搏均數(shù)相同; H1:?≠72,山區(qū)成年男子的脈搏均數(shù)與一般健康男性脈搏均數(shù)不相同。2、檢驗水準α=0.053、

9、計算檢驗統(tǒng)計量 4、按? =25-1=24查附表2 t界值表 P=P(|t|≥1.69) ?,例題的假設檢驗基本步驟,t0.05,24=2.064 P =P ( |t| ≥2.064 )=0.05,0.025,-2.064,2.064,0.025,? =24,0,P=P(|t|≥1.69)>0.05,5、本例P>0.05,按?

10、 =0.05的水準,不拒絕H0,差別沒有統(tǒng)計學意義,還不能認為山區(qū)成年男子的脈搏均數(shù)與一般健康男性脈搏均數(shù)不相同。,第二節(jié) t檢驗,單樣本設計的t檢驗配對設計的t檢驗完全隨機設計(成組設計)的t檢驗,計量資料分析的 t 檢驗,英國統(tǒng)計學W.S.Gosset (1909)導出了樣本均數(shù)的確切分布,即 t分布。t分布的發(fā)現(xiàn)使小樣本的統(tǒng)計推斷成為可能,因而它被認為是統(tǒng)計學發(fā)展史上的里程碑之一。以t分布為基礎的檢驗稱為t檢驗。,t 檢

11、驗,t檢驗亦稱student t檢驗。t檢驗的用途:樣本均數(shù)與總體均數(shù)的比較;兩樣本均數(shù)的比較。t檢驗的應用條件:當樣本例數(shù)較小時,要求樣本取自正態(tài)總體;做兩樣本均數(shù)比較時,還要求兩樣本的總體方差相等。但在實際應用中,與上述條件略有偏離,對結(jié)果亦影響不大。,單樣本t檢驗,設計類型: 例2 大量研究表明漢族足月正常產(chǎn)男性新生兒臨產(chǎn)前雙頂徑(BPD)均數(shù)為9.3cm,某醫(yī)生記錄了某山區(qū)12名漢族足月正常產(chǎn)男性新

12、生兒臨產(chǎn)前雙頂徑(BPD)資料如下:9.95、9.33、9.49、9.00、10.09、9.15、9.52、9.33、9.16、9.37、9.11、9.27。試問該地區(qū)漢族足月正常產(chǎn)男性新生兒臨產(chǎn)前雙頂徑(BPD)是否大于一般新生兒?,例3 已知北方農(nóng)村兒童前囪門閉合月齡為14.1月。某研究人員從東北某縣抽取36名兒童,得前囪門閉合月齡均值為14. 3月,標準差為5.08月。問該縣兒童前囟門閉合月齡的均數(shù)是否大于一般兒童?,單樣本t

13、檢驗,目的: 推斷該樣本是否來自某已知總體; 樣本均數(shù)代表的總體均數(shù)?與?0是否相等??傮w均數(shù)?0一般為理論值、標準值或經(jīng)大量觀察所得并為人們接受的公認值、習慣值。,單樣本設計t檢驗可解決問題,假設檢驗思路先假設? 等于?0,再判斷樣本提供的信息是否支持這種假設,若不支持,則可推斷該樣本并非來自已知均數(shù)的總體。,單樣本設計t檢驗的步驟,例4 測得25例女性患者的血紅蛋白(Hb),其均數(shù)為150 (g/L), 標準差為1

14、6.5 (g/L)。而當?shù)卣3赡昱缘腍b均數(shù)為132 (g/L),問該病女性患者的Hb含量是否與正常女性Hb含量不同?1、H0:?=132,病人與正常人的平均血紅蛋白含量相等; H1:? ≠132,病人與正常人的平均血紅蛋白含量不等。2、檢驗水準α=0.053、計算檢驗統(tǒng)計量 4、按? =25-1=24查附表2t界值表 P=P(|t|≥5.4545) ? 5、本例P<0

15、.05,按? =0.05的水準,拒絕H0,接受H1,差別有統(tǒng)計學意義,認為該病女性患者的Hb含量高于正常女性的Hb含量。,單樣本設計t檢驗的適用條件,獨立性independence正態(tài)性 normality當資料不滿足正態(tài)性—選用單樣本設計秩和檢驗如何判斷資料是否服從正態(tài)分布從經(jīng)驗或?qū)I(yè)知識判斷需作正態(tài)性檢驗,配對設計 t檢驗,配對設計是研究者為了控制可能存在的主要非處理因素而采用的一種試驗設計方法。 減少

16、了個體差異,配對設計的抽樣誤差減小,提高了統(tǒng)計效率。,配對設計的形式,配對設計有同體配對和異體配對兩種形式同體配對 *自身前后配對——對同一受試對象處理前后結(jié)果進行比較 *自身左右配對——同一對象接受兩種處理,如同一標本用兩種方法進行檢驗,同一患者接受兩種處理方法; *自身取樣配對——比如血樣、尿樣、唾液等,異體配對 將受試對象(按主要非處理因素)配成特征相近的對子,同對的兩個受試對

17、象隨機接受兩種不同的處理。 實驗動物按同種屬,性別相同,年齡、體重相近的兩個動物配成對子。 人群試驗中,將性別相同,年齡、生活、勞動條件相近的兩個人配成對子或同一批病人治療前后的某項生理、生化指標進行測量觀察。,例1 某醫(yī)生研究腦缺氧對腦組織中生化指標的影響,將白兔按出生體重配成7對,一組為對照組,一組為腦缺氧模型組。試比較兩組動物腦組織鈣泵的含量有無差別?,例2 為了研究孿生兄弟的出生體重是否與其出生順序有關(guān),共收集了15對

18、孿生兄弟的出生順序和出生體重,數(shù)據(jù)如下:,例3 現(xiàn)用兩種測量肺活量的儀器對12名婦女測得最大呼氣率(PEER)(L/min),資料如下表,問兩種方法的檢測結(jié)果有無差別?,配對t檢驗,配對t 檢驗實質(zhì)同單樣本t 檢驗。 對每對數(shù)據(jù)的差值進行檢驗,若兩處理效應相同,即?1=?2,則?d= ?1??2=0差值的樣本均數(shù) 與已知總體均數(shù)?d =0的比較,配對設計t檢驗可解決的問題,,,,,?,配對設計t檢驗的假設檢驗步驟,1、H0

19、:μd=0 H1: μd≠0 2、α=0.05 3、 4、查ν=n-1的t界值表,確定P值 5、P≤α拒絕H0,接受H1 P>α不能拒絕H0,例4 20只按體重、月齡及性別配對的大白鼠隨機分入甲、乙兩組,甲組飼喂正常飼料,乙組的飼料缺乏維生素E。10天后測定各鼠肝臟的維生素A含量,結(jié)果如下。問兩組大白鼠肝臟維生素A含量是否有差別?,例 5 現(xiàn)用兩種測量肺活量的儀器對12名婦女測得最大呼

20、氣率(PEER)(L/min),資料如表6.1,問兩種方法的檢測結(jié)果有無差別?,H0:?d=0,兩儀器檢驗結(jié)果相同;H1:?d≠0,兩儀器檢驗結(jié)果不同。雙側(cè)? =0.05 按? = n-1=12-1=11查t值表,得t0.20,11=1.363,t0.10,11=1.796,t0.10,11>t>t0.20,11,則0.20>P>0.10, 差別無統(tǒng)計學意義,尚不能認為兩種儀器檢查的結(jié)果不同。,*獨立性*正態(tài)性當資

21、料不滿足正態(tài)性——選用配對設計秩和檢驗,配對設計t檢驗的適用條件,兩獨立樣本t檢驗,又稱為成組t檢驗或完全隨機設計兩樣本t檢驗,是指分別從兩個研究總體中隨機抽取樣本,目的是推斷這兩個獨立樣本所代表的未知總體均數(shù)?1和?2是否相等,兩獨立樣本t檢驗,有些研究設計既不能作自身對比,也不便于配對。如實驗中只有把受試動物殺死后才能獲得所需數(shù)據(jù),則不可能對動物在處理前后各進行一次測定;再如比較兩種治療方法對同一疾病的療效,每個患者一般只能接受

22、一種方法的治療,把受試患者配成若干對在實際工作中又非常困難,這時只能進行兩組間均數(shù)的比較?!  ≡趦山M比較的資料中,每個觀察對象都應按照隨機的原則進行分組,兩組樣本量可以相等,也可以不等,但只有在兩組例數(shù)相等時檢驗效率才最高。,完全隨機設計類型(兩種形式),1.從同一個總體中隨機抽取兩個樣本,分別采用兩種不同的處理,比較不同處理結(jié)果是否有差異。2.從兩個總體中隨機抽取兩個樣本,兩樣本信息不同,推斷兩總體信息是否不同。,例 某醫(yī)院

23、用某新藥與常規(guī)藥治療嬰幼兒貧血,將20名貧血患兒隨機等分兩組,分別接受兩種藥物治療,測得血紅蛋白增加量(g/L)如下,問新藥與常規(guī)藥的療效有無差別?,例 某市于1973年和1993年抽查部分12歲男童對其生長發(fā)育情況進行評估,其中身高的有關(guān)資料如下,試比較這兩個年度12歲男童身高均數(shù)有無差別。1973年:n=120 均數(shù)=139.9 cm 標準差=7.5 cm1993年:n=153 均數(shù)=143.7 cm 標準差=6.3 c

24、m,完全隨機設計t檢驗可解決的問題,,,,,?,完全隨機設計t檢驗的適用條件,獨立性正態(tài)性方差齊性(equal variances) : 兩樣本來自的兩總體方差相等方差齊性判斷: 經(jīng)驗判斷 作方差齊性檢驗,完全隨機設計兩組比較假設檢驗分析思路,,,先作方差齊性檢驗,,,t檢驗,方差齊,,,方差不齊,,,,,,,變量變換,,秩和檢驗,兩樣本方差的齊性檢驗,適用條件:兩樣本來自正態(tài)分布總體推斷目的:推斷兩總體方差

25、 和 有無差別,,,,?,方差齊性檢驗步驟,1、H0: , H1: ,?=0.05 2、 式中 和 分別為較大和較小的方差, 和 分別為方差較大和較小樣本的樣本含量。 3 、根據(jù)計算得的統(tǒng)計量,查界值表(方差齊性檢驗用),作出推斷 。,,,,,,,,,完全隨機設計t檢驗的

26、假設檢驗步驟,H0:μ1=μ2, H1:μ1≠μ2α=0.05計算檢驗統(tǒng)計量t值 兩總體方差相等,可將兩樣本方差合并,求兩者的共同方差 ? 合并方差 。,完全隨機設計t檢驗的假設檢驗步驟,確定P值,作出統(tǒng)計推斷例 為研究國產(chǎn)四類新藥阿卡波糖膠囊降血糖效果,某醫(yī)院用40名II型糖尿病病人進行同期隨機對照試驗。

27、試驗者將這些病人隨機等分到試驗組(用阿卡波糖膠囊)和對照組(用拜唐蘋膠囊),分別測得試驗開始前和8周后空腹血糖,算得空腹血糖下降值見下表,能否認為國產(chǎn)四類新藥阿卡波糖膠囊與拜唐蘋膠囊對空腹血糖的降糖效果不同?,(1)建立檢驗假設,確定檢驗水準H0:?1=?2 H1:?1 ≠ ?2 ?=0.05 (2)計算檢驗統(tǒng)計量

28、 ?=n1+n2?2=2(n?1)=2(20?1)=38(3)確定P值,作出推斷結(jié)論 按?=0.05 水準,不拒絕H0,無統(tǒng)計學意義。還不能認為阿卡波糖膠囊與拜唐蘋膠囊對空腹血糖的降糖效果不同。,t’檢驗,總體方差不相等數(shù)據(jù)變換后進行t 檢驗秩轉(zhuǎn)換的非參數(shù)檢驗近似t檢驗 ? t'檢驗 (separate variance estimation t-test) 見書

29、104頁例題,兩獨立樣本幾何均數(shù)比較的t檢驗,變量變換檢驗目的:兩樣本代表的兩總體幾何均數(shù)有無差別,例:為研究甲乙兩種麻疹疫苗預防接種效果,隨機分為兩組的對象分別用甲乙兩種麻疹疫苗作預防接種,接種后在兩組隨機抽查,得到兒童注射疫苗后血凝抑制抗體效價(倒數(shù))資料如下,問甲乙兩組疫苗預防接種效果(平均效價)是否相同?,第七節(jié) 假設檢驗的兩類錯誤和注意事項,假設檢驗的兩類錯誤假設檢驗的注意事項,一、假設檢驗的兩類錯誤,假設檢驗是根據(jù)有限

30、的樣本信息對總體作推斷,由于存在抽樣誤差,不論做出那種推斷結(jié)論,都有可能發(fā)生錯誤。,一、假設檢驗的兩類錯誤,第Ⅰ類錯誤與第Ⅱ類錯誤的概念將假設檢驗的結(jié)果與實際情況相比:第Ⅰ類錯誤(typeⅠerror):H0為真時,拒絕H0(棄真)第Ⅱ類錯誤(type Ⅱ error) : H0不真時,不拒絕H0(存?zhèn)危?一、假設檢驗的兩類錯誤,兩者的關(guān)系 第一類錯誤的概率用α表示,假設檢驗時,根據(jù)研究者的要求來確定,一般取0.05或0.

31、01; 第二類錯誤的概率用β表示,它只有與特定的 H1結(jié)合起來才有意義,但β值的大小很難確切估計,僅知樣本含量確定時,α愈小,β愈大。 實際中可以通過調(diào)整α來控制β,α與β關(guān)系示意圖,?與?間關(guān)系:?大,???;?大,?小。增加n可同時?,?縮小。,?與?間關(guān)系:?大,??。?大,?小。增加n可同時?,?縮小。,假設檢驗的功效,檢驗效能:又稱把握度,用1-β表示。 1-β是指兩總體確有差別,按α水

32、準能發(fā)現(xiàn)差別的能力。比如: 1-β=0.90,意味著如果兩總體確有差別,則理論上100次檢驗中,有90次能夠得出差異有統(tǒng)計學意義的結(jié)論,減少I型錯誤的主要方法:假設檢驗時設定? 值。,減少II型錯誤的主要方法:提高檢驗效能。,提高檢驗效能的最有效方法:增加樣本量。,如何選擇合適的樣本量:實驗設計。,二、假設檢驗的注意事項,要有嚴密的抽樣研究設計 樣本的代表性與組間均衡性(可比性)所謂代表性是指該樣本從相應總體中經(jīng)隨機抽

33、樣獲得,能夠代表總體的特征;所謂可比性是指各對比組間除了要比較的主要因素外,其它影響結(jié)果的因素應盡可能相同或相近 為了保證資料的可比性,必須要有嚴密的實驗設計,保證樣本隨機抽取于同質(zhì)總體,這是假設檢驗得以正確應用的前提 。,二、假設檢驗的注意事項,根據(jù)研究目的、資料類型、設計類型及樣本含量大小選擇適當?shù)募僭O檢驗方法有統(tǒng)計學意義不等于有實際意義 如兩組降壓藥的療效結(jié)論不能絕對化 假設檢驗結(jié)論具有概率性,對于有統(tǒng)

34、計學意義的結(jié)論,要考慮Ⅰ型錯誤,對于無統(tǒng)計學意義的結(jié)論,要考慮Ⅱ型錯誤。 報告結(jié)論時,應列出現(xiàn)有統(tǒng)計量,注明單、雙側(cè)檢驗及檢驗水準,并寫出P值的確切范圍。,假設檢驗與可信區(qū)間的區(qū)別與聯(lián)系,可信區(qū)間用于推斷總體參數(shù)所在的范圍,假設檢驗用于推斷總體參數(shù)是否不同可信區(qū)間具有假設檢驗的主要功能;可信區(qū)間可以提供假設檢驗沒有的信息(可信區(qū)間在回答差別有無統(tǒng)計學意義的同時,還可以提示差別有無實際意義);,可信區(qū)間可以提供的信息,假設檢驗

35、與可信區(qū)間的區(qū)別與聯(lián)系,假設檢驗可提供可信區(qū)間不提供的信息當統(tǒng)計結(jié)論為拒絕H0時,假設檢驗可以報告確切的P值,說明檢驗結(jié)論的概率保證;當統(tǒng)計結(jié)論為不拒絕H0時,假設檢驗可以對檢驗功效做出估計??尚艆^(qū)間只能在預先規(guī)定的概率α前提下進行計算,而假設檢驗能夠獲得確切的概率P值。,假設檢驗與可信區(qū)間的區(qū)別與聯(lián)系,總之,置信區(qū)間與相應的假設檢驗既能提供等價信息,又各自有不同的功能,兩者結(jié)合起來,可以提供更全面更完整的信息,練習 10例男

36、性矽肺患者的血紅蛋白(g/dl)的均數(shù)為12.59(g/dl),標準差為1.63(g/dl),已知男性健康成人的血紅蛋白正常值為14.02(g/dl),問矽肺患者的血紅蛋白是否與健康人不同(分別用可信區(qū)間估計和假設檢驗說明)。,本例自由度?=10-1=9,經(jīng)查表得t0.05,9=2.262,則矽肺患者的血紅蛋白總體均數(shù)的95%CI:(11.424,13.756)g/dl,不包括男性健康成人的血紅蛋白的總體均數(shù)14.02(mg/d

37、l),所以說矽肺患者的血紅蛋白與健康人不同。,H0:?=14.02,矽肺患者的血紅蛋白與健康人相同;H1:?≠14.02,矽肺患者的血紅蛋白與健康人不同。?=0.05 ∵t>t0.05,9=2.262 ∴ P <0.05 按? =0.05的水準,拒絕H0,接受H1,差別有統(tǒng)計學意義。認為矽肺患者的血紅蛋白與健康人不同。,小結(jié),t分布、總體均數(shù)的估計假設檢驗的基本步驟t檢驗應用假設檢驗應注意的問題第Ⅰ

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論